Wikipedija:Projekt hrvatske semantičke Wikipedije


Projekt Semantičke Wikipedije započeo je 2005. godine s idejom olakšavanja održavanja Wikipedije te postizanja kvalitete njezinog sadržaja. Razvoj softvera približava se krajnjem cilju, a to je njegovo korištenje na Wikipediji i testiranje od strane suradnika.

Wikipedija na hrvatskom jeziku pokazala se optimalnom u pogledu veličine, kako po broju članaka, tako i po broju suradnika koji je uređuju. Time ispunjava uvjeta da bude prva Semantička Wikipedija na kojoj bi se moglo steći iskustvo u korištenju semantičke Wikipedije.

Semantička Wikipedija omogućuje davanje značenja poveznica između dvaju članaka. Ideja je, na primjer na članku Hrvatska umjesto jednostavne poveznice [[Zagreb]] napisati [[Glavni grad::Zagreb]]. Time bi se dobilo novo značenje poveznice, odnosno wiki bi "znao" da Hrvatska i Zagreb nisu povezani na bilo koje načine, već da je Zagreb glavni grad Hrvatske. Osim toga, bilo bi omogućeno da Wikipedija "odgovara" na pitanja, kao i automatsko sastavljanje popisa te njihovo automatsko ažuriranje.

Time bi se podigla razina kvaliteta sadržaja Wikipedije, budući da bi sve informacije bile na jednom mistu. Također postoji mogućnost spajanja takve informacije s inormacija s raznih Wikipedija, i provjeriti jesu li one jednake.

Time bi porastao interes za hrvatsku Wikipediju iz cijelog svijeta.

Mogući rizici uredi

  1. problemi u performansi - moglo bi se dogodit da nekoliko upita zaustaviti cijelu Wikipediju. To bi značilo da bi wikipedia mogla biti ponekad sporija.
  2. kompliciranija sintaksa - poveznice bi bile npr. [[Glavni grad::Zagreb]] umjesto [[Zagreb]], što bi moglo otežavati suradnicima, naročito onima sa skromnim informatičkim znanjem (iako je to još uvijek dosta lakš nego primjerice s predlošcima)
  3. nepoznati bugovi - razvijatelji softvera pratiti će koristenje i pokušati što brže riješiti bilo kakve probleme
  4. veći broj stranih interesenata, koji će pokušavati eksperimentirati bez razumjevanja hrvatskog jezika

Što ako netko u članku napiše da je Varaždin glavni grad Hrvatske? Onda će se u automatskom popisu pojaviti Varaždin kao glavni grad. Odgovor:

  1. moguce je provesti automatski test, i vidjeti da li svaka država ima samo jedan glavni grad
  2. moguće je pogledati da li druge wikipedije imaju istu informaciju
  3. ta informacije bi stajala na više stranica, i tako bi bila lakše otkrivena

Znači, ako danas neko napiše na članku o Varaždinu da je to glavni grad Hrvatske, to bi bilo puno teže otkriveno.

Ukratko uredi

Pitanje, da li je hrvatska Wikipedija spremna da postane prva semantička Wikipedija?

Pitanja i komentara uredi

Postavite pitanja o ovom projektu. Ili dajte ideje, želje, kritike.


Hm.. pa meni se čini kao dobra ideja... kao što kažeš hrvatska Wikipedija bi postala popularnija i izvan Hrvatske, po cijelom svijetu... sve je to super... ali postoje ti rizici u koje se ja baš ne kužim, pa... odluka je na "velikima" ! --Tonian 21:48, 31. srpanj 2007. (CEST)

Pokušao sam objasniti moguće rizike. Ako nešto nije jasno, pitaj. Odluke su nošene u Wikipediju kroz zajednicu, a ne kroz velike ;) (pa i ako ni to tako jednostavno...) Ja mislim da je važno dobiti visoki broj suradnica koji sudjeluju u diskusiju i glasenje. --denny vrandečić | razgovor 05:11, 1. kolovoz 2007. (CEST)

Dosta dobro, ali bojim se jako teško za održati. Neće biti problem nama starim suradnicima pisati takve poveznice, ali problem nastaje kada dolaze novi suradnici. Sve u svemu to će im se činiti prekompliciranim i ima veća vjerojatnost da će odustati od doprinosa na wikipediji, zbog kompliciranosti. Naime bilo je takvih slučajeva kada suradnici odustaju zbog "kompliciranih" pravila oko slika ili pisanja članaka, zamisli tek sada kako bi bilo. Uostalom imamo već 30 000 članaka gdje bi trebalo mjenjati poveznice, što bi dodatno usporilo rad i smanjio porast broja članaka, baš sad kad smo dobro krenili. Neznam, kažem ideja nije loša, ali svakako mislim da ne trebamo biti pokusni kunići, upravo zbog razloga (rizika) koje je Denny naveo, a sva ta strka oko semantičke Wikipedije strašno bi usporila našu wikipediju. I onda tek nastaje problem, što ako projekt ne uspije, a mi smo uložili puno truda i vremena u njega? Rezultat bi bio da bi hrvatska wikipedija trajno zaostala za drugim wikipedijama, imali bi puno manji broj suradnika nego da smo odbili prijedlog, uređivanje bi postalo puno teže i odbilo bi one bez nužnog informatičkog znanja, smanjio bi se broj članaka, admini i iskusniji suradnici imali bi puno više posla oko objašnjavanja novim suradnicima kako raditi takve poveznice, što bi ih automatski odvuklo od pisanja novih i kvalitetnih članaka; zatim dolaze problemi sa softverom, brojni bugovi i ostalo što bi opet morali popravljati admini ili programeri, mnogi strani suradnici bi koristili hr.wiki kao stranicu za vježbanje što dovodi do većeg broja revertanja i blokiranja i još milijun drugih problema. Sve u svemu je jako rizično i u ovom trenutku nepotrebno. Pametno bi bilo sačekati i "uvaliti" program semantičke wikipedije nekoj od drugih wikipedija, sličnoj hrvatskoj pa ćemo vidit kako se to odrazilo na njihov rad i broj članaka, sve do tada mislim da nije pametno da riskiramo. -- Kingstone 93 03:10, 2. kolovoz 2007. (CEST)

Pa pita sam sa kritiku, i evo je! :)
Hrvatska Wikipedija ne bi bio prvi Wiki da koristi semantički MediaWiki -- ali bila bi prva Wikipedija. Znači, istina, bila bi malo kao pokusni kunić. Ali ovdje je popis nekoliko 30-ak Wikija koji koriste Semantički MediaWiki, i niti jedan wiki je još ugasio semantičke mogućnosti. Zato smo sada krenuli da nađemo jednu Wikipediju, koja bi bila dobra da koristi kao prva našu naprednu tehnologiju :) Bilo bi dobro, da jedan od nas, koji radi na projektu, zna jezik te Wikipedije, i zato smo krenuli sa Hrvatsku. Druge jezike koje znamo su prevelike Wikipedije (engleska, njemačka).
Meni je Hrvatska Wikipedija naravno jako draga, i važna -- zato ne bih je doveo u neki rizik ako ne bih znao, da bih vjerovatno dobila. Gledajući reakciju medija na semantički MediaWiki, vjerovatno je da bi Hrvatska Wikipedija dobila bar par novih suradnika radi mogućih novih članaka u hrvatskim medijama.
Mislim, da bi održaj Wikipedije ustvari bio lakši, a ne teži. Samo jedan primjer: da imamo sve države svijeta napisane na semantički način, mogli bi imati popis država evrope, afričke država, države svijeta -- ali i popis svih država u kojima je Engleski službeni jezik, koji govore jedan slavenski jezik, itd. Danas engleska Wikipedija ima takvih popisa -- i mogli bi biti i na Hrvatskoj, i to bez da itko ih treba održavati. Ako se stanovništvo Mađarske promijeni, onda bi trebalo potražiti cijelu Wikipediju i popraviti stanovništvo ručno na svima tim članicama. Ali ne na Hrvatskoj Wikipediji: samo se popravi stanovništvo u članak Mađarska, i sve drugo će se promijeniti automatski. Znači, održavanje Wikipedije trebao bi postati lakši.
Ne bi bilo potrebno promijeniti današnje članke: moguće je, da se poče promijeniti članke jedne teme -- npr. povijest, ili hrvatske otoke, ili geografija Kine -- ne bi smetalo, da su samo par članka promijenuta. U stvari, često smo ćuli da je jedan veliki pozitivan aspekt našeg rada da je jako brzo koristan, a ne tek, ako je sve u redu i dobro.
Nadam se, da ne bi prepuno ljudi zaigrali s Hrvatskom Wikipedijom, jer imamo već dosta drugih Semantičkih Wikija. Vjerovatno bi puno više čitali i koristili Hrvatsku Wikipediju -- ali ne vandalisirali, ili prepuno eksperimentirali.
Točno je, da bi bilo više komplicirano editirati Hrvatsku Wikipediju --- ali ne puno. Pokledaj početak današnjeg izabranoga članka - Ptice. To je puno kompliciranije nego šta mi radimo. Ili pogledaj par potpisa -- i oni izgledaju jako komplicirani. Isto naše iskustvo na drugim semantičnim Wikijama je da novi suradnici imaju puno više problema s predlošcima ili s pravilnim korištenjem razgovornih stranica nego s semantičkim stvarima.
Nadam se da sam mogao odgovoriti na tvoje brige. Ja bi lagao da bi reka da znam šta će se dogoditi ako idemo ovim putem. Ne znam. Ali mislim da bi pomoglo hrvatskoj Wikipediji, da bi olakšalo rad na Wikipediji, i da je to daleko više prilika nego rizik. --denny vrandečić | razgovor 10:03, 2. kolovoz 2007. (CEST)
Evo Denny sad kad si mi malo to podrobnije objasnio, vidim da ovaj sustav ima dosta prednosti. Probat ću još malo proučiti rad na ovim wikijima koji imaju već program semantičke wikipedije, da vidim kako to sve funkcionira. Žao mi je što ne mogu doći na sastanak u Dalmaciju, ali što je tu je. Evo još jednom, hvala ti na odgovoru i ako me bude još nešto zanimalo ja ću te pitati. -- Kingstone 93 16:47, 2. kolovoz 2007. (CEST)

Usput imam još par pitanja. Jeli bi sve poveznice bile u ovakvom obliku [[GlavniGrad::Zagreb]] ili samo one od najveće važnosti kao npr. službeni jezik, himna, glavni grad, predsjednik...?

To odlučuje suradnik, ili, u stvari, zajednica. U glavnom ne bi trebali biti svi, niti veći dijel -- dosta bi bilo čak samo da mali broj poveznica budu napisane na novi način. Ista stvar kao s kategorijama: ne treba svaki članak imati kategoriju, da bude sistem kategorija koristan.

Nadalje kakvo bi otprilike informatičko znanje bilo potrebno za upravljanje i korištenje takve wikipedije i tog softvera, nešto slično kao s predlošcima ili?

Mislimo da je jednostavnije od predlošcima, ali sigurno ne teže. U stvari, jedan od prvih Wikija da koriste semantiku je Wiki o biblije, a oni nisu najveći tehničari. I usput, ja bi bio opet aktivan na hrvatskoj Wikipediji u to vrijeme i pomogao bi.

I na kraju, mogu li se te sematičke usluge izgasiti ukoliko se pokažu kontraprudukivinima i nepotrebnima, te ako samo usporavaju hr.wiki?

To je moguće. Nismo to još trebali, ali moguće jest.--denny vrandečić | razgovor 08:20, 4. kolovoz 2007. (CEST)

Pozdrav i čujemo se još, dotle ću ja malo gledati ove druge wiki projekte sa ovom novom tehnologijom, pa ti javim svoje dojmove i što mislim o tome ;) -- Kingstone 93 16:47, 2. kolovoz 2007. (CEST)

Evo što ja ukratko mislim o tome (ne zaboravite pročitati esej na dnu): metasranje. --Ivan Štambuk 17:38, 2. kolovoz 2007. (CEST)

Naravno da mi je Doctorowov esej poznat. I naravno da Doctorow ima pravo u par stvarima, ali ima i razlika u projektom Semantičke Wikipedije s općem korištenjem metapodacima (ovo su odgovori na Doctorowove argumente):
1. Wikipedijanci ne lažu. Ili, bare, Wikipedija kao cijela, ne laže. To je barem šta se nadamo :)
2. Wikipedijanci nisu lijeni. Ako bi bili, ne bi napisali enciklopediju.
3. Wikipedijanci nisu blesavi. Ako jesu, možda i bolje da ne bi napisali enciklopediju... :)
4. Ovo nije važno u kontekstu Wikipedije.
5. Ovo je istina i veliki problem. Ali isti problem imamo i s kategorijama. Znači: problem je, i to neriješen, ali moguće je raditi s tim.
6. Istina, ali isti odgovor kao na 5.
7. Istina, ali isti odgovor kao na 5.
Pozdrave, --denny vrandečić | razgovor 08:20, 4. kolovoz 2007. (CEST)

Dosadašnja iskustva? uredi

Projekt mi se u sebi čini korisnim, međutim pogledao sam prvih desetak od onih tridesetak wikija koji već rabe semantički MediaWiki. Pođimo redom. Archiplanet gotovo da i nema poveznica u člancima, AutoWiki gotovo da i nema članaka (svi članci koje sam kliknuo imaju samo predložak ili sliku), BionikWiki ima čini mi se samo „Main Page“ (svakako je posjetite, jer je izuzetno informativna), BO Wiki ima ukupno 10 registriranih suradnika, na BusyTonight u dva izabrana članka s Glavne stranice nisam našao ni jednu semantičku poveznicu, Centiare ima manje od tristo suradnika, a nisam provjeravao koliko koriste semantičke poveznice jer se treba ulogirati za editiranje stranica, ChemSemWiki ima četiri registrirana suradnika od čega tri birokrata (potrebno se registrirati za uređivanje). Dakle, nakon provjere tih nekoliko od tridesetak ponuđenih semantičkih wikija, zanima me ima li neki normalan primjerak u kojem bi se bez prethodnog registriranja moglo vidjeti kako stvar funkcionira? Pod normalnim primjerom podrazumijevam wiki koji ima, recimo, oko 1000 suradnika i barem toliko članaka (a da se članci ne sastoje samo od predložaka) i da se u tim člancima doista i koriste semantičke poveznice, te da se za editiranje ne treba registrirati.--Donatus 09:17, 4. kolovoz 2007. (CEST)

I ja rijetko gledam te wikije, da budem iskren. Mi koristimo to unutar naše grupe s puno uspjeha. Ako pogledam popis wikija, ja mislim da su ova dobra primjera: DiscourseDB, više od 200 registracija, oko 3400 stranica; ontoworld, koji ima puno eksperimentalnih stranica, ali isto dosta dobrih (na posebno konferencije), 900 registracija, 7500 stranica; i Simile wiki, od grupe MIT-a o njihovim projektima (više od 900 registracija, 2000 stranica). Ja mislima da su do prilično dobra primjera. 1000 suradnika su jako veliki broj, koji samo malo wikija u opće postignu (i Hrvatska wikipedija nema 1000 aktivnih suradnika). --denny vrandečić | razgovor 10:45, 4. kolovoz 2007. (CEST)
OK. Pogledat ću.--Donatus 11:12, 4. kolovoz 2007. (CEST)

Mogući sastanak uredi

Denny Vrandečić, koji radi na projektu Semantičke Wikipedije, dolazi od 11.-19. kolovoza 2007. u Dalmaciju. Možemo onda i imati jedan susret da postavimo pitanja i diskutiramo projekt, ako je to u interesu.

Ja sam u Splitu i svakako sam zainteresiran za susret, pogovoto št je Denny u pitanju :) --Ante Perkovic 23:12, 31. srpanj 2007. (CEST)

Dodatne informacije uredi