Autor: Piotr Karpiuk o 15. marca 2017
API
Każda wersja językowa dowolnego projektu Wikimedia Foundation (w szczególności: polska Wikipedia) oferuje API. O ile nie chcemy modyfikować zawartości serwisu, nie musimy się martwić o zakładanie konta i tokeny — wystarczy odpowiednio skonstruować URL zapytania aby otrzymać interesujący JSON.
Poniżej prezentuję swoistą „księgę czarów” — listę ciekawszych wywołań API. Co sprytniejszy Czytelnik może sobie manipulować URLami aby dopasować je do swoich potrzeb, a po prawej stronie każdego wpisu jest link do dokumentacji użytego zaklęcia, gdzie można poznać inne parametry zapytania.
Artykuł hasłowy na różne sposoby |
|
Wikikod artykułu hasłowego „Warszawa” |
doc |
HTML artykułu hasłowego „Warszawa”
Bez arkuszy stylów, bocznego paska, kontrolki wyszukiwania itp. |
doc |
HTML artykułu hasłowego „Warszawa”
j.w., ale zachowana struktura dokumentu i dodane pewne informacje semantyczne; może być przydatne przy parsowaniu infoboksów |
doc |
HTML artykułu „Warszawa”, wersja mobilna |
doc |
Wersja PDF artykułu hasłowego „Warszawa” |
doc |
JSON artykułu hasłowego „Piotr Abelard”
oprócz klucza text z kodem HTML artykułu jest też categories , langlinks , title , pageid , links , templates , images , externallinks , sections itp. |
doc |
Ekstrakcja fragmentu artykułu |
|
Najlepiej pasujący obrazek do hasła „Bydgoszcz” |
doc |
Podsumowanie artykułu hasłowego „Warszawa”
jednowierszowy TXT, akapit TXT i HTML, zdjęcie, współrzędne GPS, data ostatniej modyfikacji |
doc |
Jednozdaniowe podsumowanie artykułu hasłowego „Warszawa” |
doc |
Ograniczony do 175 znaków ekstrakt z artykułu hasłowego „Warszawa” |
doc |
Powiązania |
|
Linki z artykułu hasłowego „Albert Einstein” do innych haseł |
doc |
Wszystkie przekierowania (aliasy) do hasła „Maria Skłodowska-Curie” |
doc |
Tłumaczenia hasła „Warszawa” na inne języki |
doc |
5 artykułów powiązanych (ang. related) z artykułem hasłowym „Warszawa” |
doc |
100 haseł semantycznie podobnych (ang. similar) do hasła „Polska”
Inna technika, wykorzystuje ElasticSearch |
doc |
Podkategorie kategorii „Fizyka” |
doc |
Hasła kategorii „Fizyka”
Aby wyciągnąć kolejnymi zapytaniami wszystkie wyniki, trzeba obsłużyć klucz continue w wynikowym JSONie |
doc |
Które strony mają linki do artykułu hasłowego „Warszawa” |
doc |
Które artykuły hasłowe zawierają link do „blog.tiger.com.pl” |
doc |
Do jakich obiektów z WikiData odwołuje się artykuł hasłowy „Warszawa” |
doc |
Które artykuły hasłowe wykorzystują encję Q444 (Lech Wałęsa) portalu WikiData |
doc |
Wyszukiwanie haseł |
|
Wyszukiwanie artykułu hasłowego: „Einstein”
W tytule (domyślnie), w treści, rozmyte w tytule |
doc |
Wyszukiwanie prefiksowe artykułu hasłowego: „Alb” |
doc |
Lista szybkich podpowiedzi dla łańcucha „Warsz”
generowana np. po wprowadzeniu kolejnej litery w polu wyszukiwania hasła |
doc |
Współrzędne GPS |
doc |
Współrzędne GPS dla hasła „Warszawa” |
doc |
Hasła obiektów w promieniu 10km od punktu o współrzędnych 52.2760,20.9679 |
doc |
Statystyki |
doc |
1000 najpopularniejszych haseł na plwiki w dniu 2017-07-11
Można rozróżnić wejścia mobilne/desktopowe |
doc |
Dla artykułu „Warszawa”: liczba odwiedzin z podziałem na miesiące w okresie od 2008-01-01 do 2016-12-31 |
doc |
Liczba odwiedzin dla całej plwiki w dniu 2017-07-12 w godz. 06-10
Można z podziałem na miesiące, dni lub godziny |
doc |
Liczba urządzeń odwiedzających plwiki w dniu 2017-07-12 w godz. 06-10 |
doc |
Statystyki odwiedzin artykułu hasłowego „Warszawa” codziennie przez ostatnich 60 dni |
doc |
100 Najpopularniejszych hasłeł w poprzednim dniu |
doc |
Liczba odwiedzin polskiej Wikipedii codziennie przez ostatnich 60 dni
Można też użyć metryki liczby unikalnych użytkowników |
doc |
Metadane |
|
Zbiorcze podsumowanie metadanych wszystkich wersji językowych wszystkich projektów Wikimedia Foundation |
doc |
Opis wszystkich przestrzeni nazw polskiej Wikipedii |
doc |
Opis parametrów modułów i submodułów |
doc |
Lista wszystkich możliwych nazw właściwości artykułów hasłowych |
doc |
Inne |
|
Ostatnie zmiany na plwiki |
doc |
Lista pierwszych 500 kategorii
Aby wyciągnąć kolejnymi zapytaniami wszystkie kategorie, trzeba obsłużyć klucz continue w wynikowym JSONie |
doc |
Lista pierwszych 500 haseł zaczynających się prefiksem „Polska „ |
doc |
j.w., ale dla każdego hasła dodatkowo wymienione są ewentualne prowadzące do niego przekierowania |
doc |
Lista pierwszych 500 kategorii
Dla każdej informacja o liczbie podkategorii i artykułów hasłowych |
doc |
Lista wszystkich haseł ujednoznaczniających |
doc |
Lista wszystkich haseł zabezpieczonych przed edycją |
doc |
Lista 15 losowo wygenerowanych haseł |
doc |
Lista 15 najnowszych zweryfikowanych haseł |
doc |
Lista 15 niezweryfikowanych haseł |
doc |
Czytaj więcej »
Tags: api, wikimedia, wikipedia, wmf
Napisany w Bazy danych | Brak komentarzy »