Eric SievertsWe zingen altijd de lof van zoekmachines. Wat je daar niet allemaal mee kunt vinden en hoe slim ze soms wel zijn. Toch leeft er onder gebruikers heel wat ontevredenheid. Zij vinden meestal veel te veel en dan vaak nog niet eens wat ze zochten. Nogal wiedes, denk ik dan, moeten ze maar slimmere zoekvragen stellen. Net of dat zo makkelijk is, realiseer ik me ook. We zijn niet allemaal informatie professionals en zelfs die zoeken niet altijd zo goed. Daarom is elk afwijkend mechanisme om informatie te vinden meer dan welkom. Laten we eens kijken hoe Alexa dat doet. |
||
|
Zoekmachines laten je in de steek Wat is er zoal mis met gewone zoekmachines en ook met directory diensten als Yahoo? Een heleboel, als je nog eens goed kijkt hoe ze eigenlijk werken. Je komt er binnen, je stelt een vraag of bladert door de onderwerpsboom en je vindt hopelijk iets. Maar waardoor wordt eigenlijk bepaald wat je vindt? Natuurlijk door de zoektermen die je hebt gebruikt, of door de categorie die je hebt gekozen. Maar vooral door al die woorden die toevallig in al die 120 miljoen geïndexeerde web-pagina's voorkomen en door de plaats waar ze in die pagina's staan. Of door de intellectuele activiteit van die ene persoon die een aangemelde web-pagina indeelt onder de een of twee categorieën die hem op dat moment geschikt voorkwamen. |
Of je daarmee in alle gevallen de voor jou goede, of liever nog de voor jou beste
pagina's vindt, is natuurlijk hoogst twijfelachtig. Als zoeker heb je immers allerlei
onuitgesproken, dan wel onuitspreekbare - en vaak ook onbewuste - randvoorwaarden in je hoofd, waar de te vinden informatie eigenlijk ook aan moet
voldoen. Context van het onderwerp, niveau van behandeling, aard van de
informatie, toepassing waarvoor bedoeld, al aanwezige kennis die niet nog eens
gedupliceerd hoeft te worden, enzovoort.
Als je in de gevonden lijst al eens iets ziet dat goed lijkt, dan klik je dat vervolgens aan en dan...? Dan laat de zoekmachine je verder in de steek. Je zit op die andere pagina en je hulpje AltaVista of Yahoo is in geen velden of wegen meer te bekennen. OK, je kunt natuurlijk de back-knop gebruiken, maar wat als je al 10 stappen verder gedwaald bent door de gevonden site? |
|
![]() |
||
|
Alexa doet er wat aan.
Aan al dit soort problemen probeert Alexa iets te doen. Wat is Alexa? Het is een hulpprogramma dat je gratis kunt downloaden en dat je vervolgens op je harde schijf installeert. Zodra je je web-browser - Netscape of Internet Explorer - opstart, wordt ook Alexa opgestart. Dat zie je aan een grijze balk die, eigenlijk nogal hinderlijk, dwars over je web-scherm loopt. In de praktijk schuif ik die balk dus altijd onmiddellijk zo ver mogelijk naar beneden weg, maar zelfs dan neemt hij nog wel wat van je kostbare schermruimte weg. Er zal dus heel wat tegenover moeten staan, wil ik dat nadeel op de koop toe nemen. Verder doet Alexa nog niets. Het wacht gewoon. Het wacht tot jij iets doet, tot jij een web-pagina oproept. Je zult dus toch in eerste instantie zelf moeten zoeken, zelf al een pagina over je onderwerp moeten weten, zelf een URL van een collega hebben doorgekregen of in de krant gelezen moeten hebben. Maar dan komt Alexa wel in actie. |
Zodra je een web-pagina opvraagt, een link aanklikt, een bookmark activeert,
kortom zodra je web-browser via een URL ergens een web-pagina opvraagt, wordt
dat URL stiekem door Alexa onderschept en ook doorgestuurd naar de eigen Alexa-computer in Californië.
En tegen de tijd dat de opgevraagde web-pagina op je
scherm staat - soms zelfs al iets eerder en helaas soms pas aanzienlijk later -,
heeft
Alexa als het goed is, en dat is het helaas ook niet altijd, al een heleboel nuttige
informatie voor je opgehaald. Je hoeft maar ergens in de grijze Alexa-balk te klikken
en je krijgt die informatie te zien. Achtergrondinformatie over aard en kwalitatieve
aspecten van de opgevraagde pagina en een lijstje van maximaal 10 "related links",
andere pagina's elders op het web, die een inhoudelijke relatie met de oorspronkelijk
opgevraagde pagina hebben.
Alexa laat je dus niet in de steek, zoals al die andere zoekhulpmiddelen, want welke web-pagina je ook aanklikt, die grijze Alexa-balk blijft altijd aanwezig en wordt bij elke nieuwe pagina die je opvraagt weer ververst met nieuwe informatie uit de Alexa-computer. En zelfs een mededeling dat hij geen informatie heeft zegt nog wel iets, zoals we direct zullen zien. |
|
![]() |
||
|
Waarom heet hij/zij Alexa?.
Nu dringt zich natuurlijk de vraag op hoe Alexa dat allemaal doet. Daarvoor kijken we eerst eens waar de naam Alexa eigenlijk vandaan komt. Het zijn de eerste vijf letters van "Alexandrië", daarmee verwijzend naar de bibliotheek die rond het begin van onze jaartelling in die stad aan de Nijl-delta stond en waarvan beweerd werd dat alle schriftelijk vastgelegde kennis van dat moment daar verzameld zou zijn. Al spreken we nu niet meer van "kennis", maar van de wat ruwere grondstof "informatie", de initiatiefnemers van Alexa streven dat zelfde doel na voor de inhoud van Internet. Niet zoals bij de zoekmachines door het aanleggen van een telkens ge-update index van wat waar aanwezig is, en evenmin door het samenstellen van een lijst met hyperlinks zoals bij de directory-diensten. Nee, ze doen dat, als in een ouderwetse bibliotheek, door echte volledige kopieën van al die op het web aanwezige documenten te bewaren. Wat dit project extra interessant maakt, is dat de weggeschreven "kopie van het web" niet elke maand opnieuw wordt overschreven door een nieuwe kopie, maar dat die nieuwe kopie gewoon daarnaast bewaard wordt. Allerlei intussen al lang weer van het web verdwenen informatie, ook die pre-print van dat artikel met die enorme blunder dat door de auteur ijlings van zijn site verwijderd was, wordt bij Alexa dus nog steeds bewaard. |
Hoewel Alexa nog lang geen 120 miljoen pagina's archiveert,
een aantal dat door sommige grote zoekmachines wordt geïndexeerd, maar
hoogstens een paar miljoen, is daar natuurlijk een enorme opslagcapaciteit voor
nodig: vele tera-bytes.
Wat heeft dit nu allemaal te maken met de diensten die het Alexa-programma ons biedt? Dat hangt samen met de manier waarop Alexa zijn informatie over bestaande web-sites verzamelt en met de extra informatie die daarbij tevens wordt vastgelegd. We zagen al dat elke keer dat een Alexa-gebruiker een web-pagina opvraagt, het URL daarvan aan de centrale Alexa-computer wordt doorgegeven. Dat is natuurlijk een goedkope manier om aan nieuwe adressen van web-pagina's te komen. En dan van waarschijnlijk echt interessante, want in de praktijk geraadpleegde. Net zoals bibliotheken, toen ze nog genoeg geld hadden, aanschafsuggesties van gebruikers plachten te honoreren. Daarnaast wordt echter meer informatie verzameld. Anoniem, zoals Alexa ons met de hand op het hart verzekert, wordt tevens bijgehouden welke wegen de Alexa-gebruikers over het web volgen. Als veel gebruikers na een bezoek aan pagina A, vervolgens naar pagina B gaan, dan zullen die twee pagina's wel iets met elkaar te maken hebben. Dat is een soort informatie die in bibliotheken nog niet van het leengedrag wordt bijgehouden, maar dat wel al bij Internet-boekhandels wordt toegepast om ons gerichte aankoopsuggesties te doen. Op dezelfde manier gebruikt Alexa deze informatie om bij een door ons bekeken pagina verwante pagina's te kunnen suggereren. |
|
![]() |
||
|
Werkt het ook?.
Degelijk onderzoek of het mechanisme van Alexa ook in de praktijk goed werkt, ben ik nog niet tegengekomen en heb ik zelf ook niet uitgevoerd. Bij wat praktijkproefjes bleek, zoals zo vaak bij retrieval-innovaties, dat het soms wel en soms niet tot zinnige resultaten leidt. Interessant is het natuurlijk pas om naar echt inhoudelijke pagina's te kijken en niet, zoals in sommige Amerikaanse productbesprekingen gedaan werd, te kijken welke andere pagina's gesuggereerd worden als je zelf op een heel algemene site als Yahoo staat; al blijkt het mechanisme zelfs bij dat soort pagina's te werken). Het voorbeeld van Millennium informatiepagina's in de afbeeldingen laten in elk geval zinnige suggesties zien. Zelfs een redelijk obscure pagina ergens diep in de site van het Nederlandse "Millennium Platform Zorg" bleek bij Alexa bekend te zijn en suggesties voor andere (Amerikaanse) Y2K sites op te leveren. Toegegeven, die pagina's had je met een gewone zoekactie misschien ook wel gevonden, maar ik verwacht dat de door Alexa gegeven verwijzingen betere pagina's zijn dan zo'n zoekmachine levert. Een heleboel andere mensen moeten immers ook al naar deze pagina's zijn doorgesurfd en die zullen zich vast niet allemaal in de kwaliteit daarvan vergist hebben. |
Het surf-gedrag van al die
voorgangers geeft bovendien een redelijke garantie dat context, niveau, aard,
enzovoort van de zo gevonden informatie vast niet al te veel zullen verschillen van je
eigen onuitgesproken randvoorwaarden.
Een vraag die mij nog wel blijft bezighouden is in hoeverre dit een zichzelf versterkend systeem is. Als een bepaalde reeks pagina's door Alexa gesuggereerd wordt op grond van navigatiegedrag van eerdere Alexa-gebruikers, zullen nog meer Alexa-gebruikers op die manier gaan navigeren en zal de relatie dus steeds hechter in het systeem verankerd worden. Over een paar maanden moet ik nog maar eens kijken of bij de nu door mij bekeken pagina's nog altijd dezelfde 10 andere pagina's worden gesuggereerd of dat daar in de loop der tijd toch nog verandering in is gekomen. Wat moet je verder concluderen als bij een bepaalde pagina geen informatie over "related links" beschikbaar is? Dan kent Alexa de betreffende pagina kennelijk niet. Dan is hij niet eerder door voldoende Alexa-gebruikers bezocht. En dan zal hij dus waarschijnlijk niet zo interessant, belangrijk, nuttig of degelijk zijn. Ook dat kan soms nuttige informatie zijn, naast de extraatjes die Alexa verder nog biedt. |
|
![]() |
||
|
Meer functies.
Behalve suggesties voor andere pagina's geeft Alexa ook informatie over de actieve pagina zelf. Of liever gezegd over de hele site waartoe die pagina behoort. Uit gegevens van InterNIC wordt informatie over de betreffende organisatie gehaald. Er wordt getoond hoeveel pagina's op die site aanwezig zijn, hoe druk de site als geheel wordt bezocht, hoe snel de server is waar de site op draait en hoe regelmatig de inhoud wordt bijgewerkt (de "freshness"). Al die gegevens zeggen indirect al iets over de kwaliteit van de site. Een veel directere maat daarvoor wordt gegeven door de vermelding hoeveel web-pagina's van elders naar deze site verwijzen. Haast zoiets als de klassieke impact factoren uit ISI's "journal citation reports". Daarnaast kunnen Alexa-gebruikers ook nog hun stem uitbrengen over de kwaliteit van een bezochte site. Hoewel bijna niemand dat blijkt te doen, worden de daaruit voortkomende kleine aantallen "Like" en "Dislike" ook getoond. |
Voor Alexa-gebruikers staat nog een andere mogelijkheid open om bewust iets bij te dragen. Je kunt namelijk actief links aanmelden naar "related sites" die je zelf belangrijk vindt. Op die manier hoef je dus niet expres 10 keer heen en weer te navigeren in een poging de surf-statistieken te beïnvloeden. Yot slot nog een andere Alexa-functionaliteit die in sommige besprekingen haast nog meer aandacht krijgt dan de mooie "related links" lijsten. Doordat Alexa op geregelde tijden de inhoud van het web archiveert, heb je kans dat intussen verdwenen of verplaatste pagina's daar nog aanwezig zijn. Bij bekende foutmeldingen als "HTTP Error 404", "Not Found" of "Error The requested URL could not be retrieved", kun je een knop in de Alexa-balk aanklikken waarmee zo'n niet meer op het betreffende adres aanwezige pagina uit het Alexa-archief wordt opgevraagd. In de praktijk levert ook dat nog vaak de melding "Page not available from the Alexa archive". Tenslotte zit lang niet het hele web in hun archief en draaien ze ook niet elke dag een back-up van het web. Maar ook die enkele keer dat je zo toch nog bij een verdwenen pagina kunt komen is mooi meegenomen. |
|
![]() |
||
|
In Netscape ingebouwd.
Gebruikers van nieuwere versies van Netscape - vanaf versie 4.5 - hebben in het voorgaande misschien iets bekends herkend. Dat klopt. De knop "What's related", rechtsboven in de zogenaamde "location toolbar", doet precies hetzelfde als Alexa's "related links" en is gebaseerd op dezelfde Alexa-software. Toch zijn er wel verschillen. De extra functionaliteit van het tonen van kwaliteitsaspecten van de bezochte site en het uit het archief opvragen van verdwenen pagina's wordt door Netscape niet geboden. |
En ook de achterliggende database blijkt een andere te zijn. Pagina's waarvoor Alexa wel verwante pagina's suggereert, blijken bij Netscape's "What's related" soms onbekend te zijn en wel getoonde verwante pagina's blijken vaak andere te zijn. Voordeel van de wat kalere Netscape versie van het Alexa-mechanisme is natuurlijk dat je geen extra software op je PC hoeft te installeren en dat je geen last hebt van die vervelende grijze Alexa-balk. | |
|
|
|
Al met al vind ik Alexa toch zo veel toegevoegde waarde bieden en, naar het mij toeschijnt, een grotere database dan de Netscape-versie, dat ik het rustig op mijn PC laat staan en die hinderlijke grijze balk inderdaad op de koop toe neem. Wie Alexa ook eens wil uitproberen, kan het programma downloaden op http://www.alexa.com/download/ Een paar andere artikelen over Alexa zijn te vinden op onder meer: http://chronicle.com/data/articles.dir/art-44.dir/issue-26.dir/26a02701.htm http://www.feedmag.com/cgi-bin/FeedlineLoop/deliverance.cgi?areanum=35:35 |
|
|
|||
| © |
Informatie Professional (Otto Cramwinckel Uitgever, Amsterdam)
en Eric Sieverts
Voor een abonnement op Informatie Professional:
|
||