wtorek, 11 stycznia 2011

Jak zwizualizować 100 GB danych tekstowych Google?

Ciekawe wiadomości wyświetlane w http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
Anonimowy czytelnik pisze: "Jest niesamowity serii wykresów, które wizualizuje trygramów i bigrams, części zdania, które zostały wyodrębnione na podstawie danych internetowych Google komplecie. Wykresy podkreślić związki słowa i częstotliwość ich używać na stronach internetowych. Chris Harrison z Carnegie Mellon University znaleźć, na przykład, że słowo "on" jest często powiązane z "twierdzi", a "ona" znajduje się często z "kocha". Istnieją również słowo stosunku wykresów, które podkreślają słowa używane w połączeniu z ich przeciwieństwa, takie jak dobre i złe, pokoju i wojny, i PC i Mac. " Istnieje wiele z tych rzeczy, a oni naprawdę interesujące przeglądać.

Czytaj więcej tej historii w Slashdot.




Brak komentarzy:

Prześlij komentarz