Scott Tiger Tech Blog

Blog technologiczny firmy Scott Tiger S.A.

Archiwum dla Marzec 26th, 2015

Carrot2 Clustering Engine

Autor: Piotr Karpiuk o 26. marca 2015

Carrot2 to stworzona przez panów Dawida Weissa i Stanisława Osińskiego z Politechniki Poznańskiej alternatywa dla Googlowej wyszukiwarki. Jej bardzo interesującą funkcją jest grupowanie wyników wyszukiwania. Przykładowo gdy pytamy o „apple”, osobno będziemy mieli pogrupowane informacje o owocach, a osobno o firmie Apple Inc. Wyszukiwarka obsługuje kilka różnych algorytmów (Lingo jest wolniejszy, ale produkuje etykietki grup lepszej jakości niż STC) i obsługuje jedynie języki angielski, niemiecki, francuski, włoski i hiszpański. Być może ciekawsza nawet niż sama wyszukiwarka jest używana pod spodem otwartoźródłowa, dobrze udokumentowana biblioteka Javy, której można użyć we własnych projektach do grupowania rekordów (np. wyników wyszukiwania) zawierających tekst w jednym z 19 języków, m.in. obsługiwany jest język polski.

Napisany w Lingwistyka | Brak komentarzy »