Standardid ja Eesti veebimaastiku olukord nende osas

  • Proseminaritöö uurimisprojekt.
  • TPÜ Haapsalu Kolledž: Infotehnoloogia osakond.
  • Juhendaja: Jaagup Kippar.

Käesolev dokument on saadaval ka PDF-formaadis (152KB).

Sisukord

Sissejuhatus

Veeb on noor meedia. Meedia, millel puuduvad selged piirid ja kammitsad. Selline vabadus loob meile ühelt poolt suured võimalused oma mõtete ja ideede teostamiseks, ent tõeline vabadus ei saa olla anarhia, kus igaüks lihtsalt teeb seda, mis tal pähe tuleb ja ei arvesta mitte põrmugi teiste huvidega, hoomamata sealjuures, et need teiste huvid võivad tegelikult olla ka tema enese huvid.

Kui Veebi looja Tim Berners Lee 1994. aastal asutas Ülemaailmse Veebikonsortsiumi (World Wide Web Consortium – W3C) (Jacobs 2000), siis oli ideeks tuua korda ja tasakaalu sellesse ettearvamatusse hüpertekstimaailma – nii et hundid oleks söönud ja ka lambad terved – seda ideed kannab W3C tegevus kuni tänaseni.

W3C tegevuse põhisuunaks oli ja on mitmesuguste standardite (tuntud kui W3C soovitused – recommendations) väljatöötamine. Kuna veebi põhiliseks formaadiks on HTML (Hypertext Markup Language – hüperteksti märgenduskeel), siis on kõige suuremad kired keerelnud just selle märgenduskeele ümber. Alates esimesest veebilehitsejast ehk brauserist nimega World Wide Web hakkasid paljud brauseritootjad välja mõtlema mitmesuguseid täiendusi HTML-keelele, mis algselt ei võimaldanud mitte midagi muud kui lihtsalt teksti struktureerida. Mosaic tuli välja võimalusega kasutada lisaks tekstile ka pilte, Netscape tegi võimalikuks veebilehtede skriptimise luues JavaScript´i nimelise programmeerimiskeele jne. Kõik see viis välja selleni, mida tuntakse kui brauserite sõda (browser wars), mis toimus Microsoft Internet Explorer´i (IE) ja Netscape Navigator´i vahel ning millest väljus võitjana IE.

Ka brauserisõdade aegu olid juba olemas W3C loodud standardid, aga brauseritootjad ei hoolinud neist kas üldse mitte või proovisid nende alusel luua teatud sorti oma nägemuse. Tänaseks on siiski selgeks saanud, et ilma ühtse standardita me kaugele ei jõua. Ühegi veebiarendaja jaoks pole mõistlik kasutada mingi kindla brauseri spetsiifilisi lahendusi, sest tehes nõnda on oht kaotada teisi brausereid kasutavad kliendid. Brauseritootjad ei võistle enam mitte selles, milliseid uue funktsiooniga HTML-i elemente nad välja mõtlevad vaid selles, kuivõrd hästi keegi neist toetab W3C standardeid (isegi selles vallas paljukirutud Microsoft on teinud pingutusi selles vallas ja paistab jätkavat (Preview... 2004)). Standardsete, kõigis moodsates brauserites ühtviisi töötavate (ja vanemates kenasti degradeeruvate) lahenduste loomine, on hetkel lihtsam kui kunagi varem.

Ent kas ka veebidisainerid ja programmeerijad seda endale teadvustavad? Üldine praktika näitab, et enamasti mitte. Endiselt on levinuimaks brauseriks IE, mis saab automaatselt iga uue Windowsi kasutaja kaaslaseks ning milleks hoolida ülejäänud marginaalsest hulgast alternatiivsete brauserite kasutajatest – tühi töö ja vaev?

Viimaste aastate jooksul on aga alternatiivsete brauserite kasutamine suurenenud üha ning IE viimane versioon 6.0, millel vanust juba mitmed aastad, mõjub nende noorte tegijate kõrval (kelle viimane väljalase pole ühelgi juhul vanem kui aasta), tõelise vanurina. Ning mitte ainult brauserid pole põhjus kasutamaks standardset ja korrektset HTML-i, ka otsingurobotid, Google´iga eesotsas, suudavad lehekülge paremini indekseerida. Kuigi semantiline HTML otseselt otsingumootorite hinnangut lehest ei mõjuta (Meyer 2004).

Suure ja olulise tõuke standardite kasutamise suunas on andnud ka mitmete riikide valitsused, eesotsas USA-ga. Nimelt on seadustes, mis määravad tingimused riigiasutuste kodulehekülgedele küllaltki kõrged nõudmised ligipääsetavuse osas, kusjuures soovituslikuks meetodiks ligipääsetavuse tagamiseks on korrektne HTML-i ja CSS-i (Cascading Style Sheets – kaskaadivad stiililehed) kasutus. Hoolimata seadustest pole olukord nendes riikides veel kaugeltki kiiduväärne, ehkki see paraneb järjest. Eestis puuduvad aga vastavasisulised seadused üleüldse.

1. Probleemi kirjeldus

1.1. Uuringud Eestis

Vaadates vaid mõningaid populaarsemaid veebilehekülgi ei saa me teha oluliselt täpsemaid järeldusi kui: „Enamik Eesti veebilehti veebistandardeid ei järgi.” Konkreetsemad uuringud antud valdkonnas on aga puudulikud. On küll Valdo Prausti poolt 2002. aasta lõpus teostatud „Eesti riigiasutuste veebilehtede käideldavustest” (Praust 2002, 2003), mis aga käsitleb vaid käideldavusega seotud probleeme ning sedagi vaid mõnekümnel riigiasutuse leheküljel.

Uuringuid, mis aga käsitleksid veebilehtede standarditele vastavust (valideerivust) pole aga teostatud üldse, va muidugi pisemat sorti testimised, mida üks või teine eraisik on oma puht isiklikust huvist teinud (näiteks minu poolt korraldatud uuring Eesti veebidisainifirmade avalehtede HTML-i valideerimise kohta).

1.2. Uuringud mujal

Mujal maailmas on küll mõningaid uuringuid korraldatud, kuid enamasti on need olnud kas liialt väikese mahuga või liialt pealispinnalised. Järgnevalt toon ära uurimused, mille kohta on õnnestunud informatsiooni hankida; täpsemad arvandmed on ära toodud tabelis 1.

  1. 1997 Thomas Dowling Validating HTML (tegemist on artikli nimega, tegelik uurimus on läbi viidud enne artikli kirjutamist). Teostati 624 Põhja-Ameerika raamatukogu kodulehekülge valideerimine HTML 3.2 dokumenditüübi alusel.
  2. 2003 Greg Lanier Universal web design: a survey of web accessibility and usability. Uuriti 41 väljavalitud lehekülge erinevatest valdkondadest (otsingumootorid, valitsusasutused, veebistandarditega seotud leheküljed, ...). Uuriti valideerivust ja vastavust Section 508 ning WCAG 1.0 ligipääsetavusnõuetele ning hinnati HTML-leheküljel oleva teksti ja selle esitamiseks vajamineva koodi osakaalu.
  3. 2. märts 2004 Soren Johannessen The use of W3C standards in Denmark. Uuriti 2033 Taani valitsus-, rahvus- ja munitsipaalasutuse lehekülje valideerivust. Lisaks tuvastati kui paljudel lehekülgedel on olemas dokumenditüübi deklaratsioon ning erinevate dokumenditüüpide osakaalud.
  4. 16. märts 2004 Soren Johannessen Danish companies and the use of W3C standards. Täpselt samas vormis uuring, mis eelmine. Sel korral teostatud 250 Taani äriettevõtte koduleheküljel.
Uurimus Lehekülgede arv Valideerivaid lehti Protsent Keskmine vigade arv
1 624 24 3.80% 20
2 41 7 17.00% 109
3 2033 62 3.10%  
4 250 1 0.40%  

Tabel 1. Erinevate uurimuste tulemuste võrdlus.

1.3. Ülesanne

Kuna puudub ülevaade sellest, milline on olukord veebistandardite järgimise ja seega ka lehekülgede kvaliteedi osas, siis oleks tarvis teostada uuring, mis käsitleks Eesti veebilehekülgede valideerivust leheküljele määratud dokumenditüübile, mis olekski antud proseminaritöö teemaks.

2. Materjal ja metoodika

2.1. Probleemid varasemate uurimustega

Eelmises peatükis loetletud HTML-i valideerivuse uuringutel ilmnes mitmeid probleeme:

  1. Paljusid lehekülgi ei saanud valideerida, kuna puudus dokumenditüübi deklaratsioon.
  2. Paljusid lehekülgi ei saanud valideerida, kuna neil kas puudus kasutatava kooditabeli määratlus või oli see vale.
  3. Valideerimisel mõõdeti vaid vigade arvu (kui sedagi), mis aga iseenesest pole eriti heaks kriteeriumiks hindamaks lehe kvaliteeti. Põhjuseid on kolm:
    1. Kõigest üks tilluke viga dokumendi alguses võib tekitada tuhandetesse (reeglina ühte-kahte tüüpi) vigadesse ulatuva kaskaadi.
    2. Enamik mittejuhuslikke vigu HTML-is reeglina korduvad (näiteks kui ei teata, et piltidele tuleb kindlasti määrata alternatiivtekst, siis arvatavasti ei tehta seda ühegi pildi puhul, aga pilte võib leheküljel olla sadu).
    3. Osad validaatori antavad veateated pole mitte vead vaid viited eelmise vea potentsiaalsele tekkekohale.

2.2.Meetmed uuringu parandamiseks

Vältimaks nimetatud probleeme tuleks kavandatavas uurimuses võtta kasutusele järgmised meetmed:

  1. Dokumenditüübi puudumise probleemi on lahendanud hiljutine W3C validaatori uuendus, mis kasutab dokumenditüübi puudumisel HTML 4.01 Transitional dokumenditüüpi, mis on kõige laiahaardelisem ja ühtlasi kõige leebem dokumenditüüp. Samas peab hoolitsema selle eest, et hilisemas infotöötluses oleks võimalik eristada millistel lehtedel dokumenditüübi määrang puudus ja millistel oli see olemas.
  2. Kooditabeli määrangu puudumisel tuleks pakkuda mõnda ISO 8859 perekonda kuuluvat tabelit (validaator neil vahet ei tee, sest programmi jaoks pole oluline, kas on kirjutatud „želee“ või „þelee“ ja enamasti on veebilehed just mõnes sellises ühebaidises vormingus, mis aga läheb vastuollu W3C validaatori poolt vaikimisi kasutatava mitmebaidise UTF-8 kodeeringuga). Mõistagi tuleb hilisemast kodeeringute kasutamise analüüsist välja jätta need leheküljed, millel kodeering algselt määratletud polnud.
  3. Valideerimisel tuleks koguda infot erinevate vigade esinemissageduste kohta, mis annaks võimaluse analüüsida lisaks vigade hulgale lehel ka erinevate vigade hulka ning enimlevinud vigu. Samuti saab sel teel validaatori veateadete hulgast „mitte päris vead“ välja praakida.

Töö maht peaks olema võimalikult suur – plaan on käia validaatoriga üle kõik(!) www-ga algavad ja .ee-ga lõppevad leheküljed. Vaatluse alla tulevad siiski vaid avalehed järgneval kolmel põhjusel:

  1. Avalehe kallal lehekülje loojad reeglina kõige rohkem vaeva näinud.
  2. Üheainsa parajalt mahuka kodulehekülje kõigi alamlehtede läbikäimine võib osutuda juba omaette hiigeltööks.
  3. Ka kõik teised uuringud on keskendunud vaid avalehtedele.

2.3.Töös kasutatavad vahendid

  1. W3C Validaator (W3C Makup Validation Service) - valideerimise teostamiseks.
  2. Omaloodud programm – suure hulga lehekülgede validaatorile etteandmise ja andmete kogumise automatiseerimiseks.
  3. Tabelitöötlusprogramm hilisemaks andmete statistiliseks analüüsimiseks.

Kokkuvõte

Uurimustöö „Standardid ja Eesti veebimaastiku olukord nende osas” peaks muu hulgas andma vastused järgmistele küsimustele:

  1. Kui suur osa Eesti veebilehekülgedest valideerib?
  2. Millised on levinuimad vead veebilehtede koodis?
  3. Milline on erinevate dokumenditüüpide kasutamise osakaal?
  4. Milline on erinevate kooditabelite kasutamise osakaal?

Vastava mass-valideerimise programmi loomine peaks hõlbustama sarnaste uuringute kordamise tulevikus ja/või teistel lehekülgedel.

Viited

Kirjutatud 10. jaanuaril 2005.

Trinoloogialeht

Eesti Trinoloogide Maja. Eesti trinoloogiahuviliste avalik kogunemiskoht. info@triin.net

Peamenüü

Samal teemal

RSS, RSS kommentaarid, XHTML, CSS, AA