Paradigmskifte för strukturerad information?

Igår lanserades Google Base på riktigt efter en tillfällig aptitretande låtsaslansering för ett par veckor sedan.

Vad är Google Base?
På Google Base kan vem som helst kostnadsfritt publicera välstrukturerade informationsposter (Items). Posterna blir enkelt sökbara i Google och därmed kan man få god exponering av sin information. Tack vare att posterna är välstrukturerade kan Google Base erbjuda gränssnitt där man kan sortera informationen mycket bättre än i vanliga Google. Till exempel kan man sortera och göra urval med avseende på pris, klockslag, ålder osv. Detta är inte möjligt för de ostrukturerade data som man kommer åt med ”vanliga” Google. En annan skillnad mellan att ha en post på Base och att ha samma information på en webbplats som indexeras av vanliga Google är att posterna på Base är garanterat åtkomliga för Google (till skillnad från många databasposter på webbplatser, som ofta bara syns vid manuella sökningar och alltså ligger på den s.k. osynliga webben).
Vissa kommentatorer har kallat detta för en ny databasplattform, som kan konkurrera ut MySQL och Oracle mm.

Att publicera på Google Base
Antingen väljer man att använda en befintlig informationstyp (Item type) eller så skapar man en egen typ genom att namnge ett antal attribut och ange vilken datatyp de har (text, integer, url osv.). Att skapa en egen informationstyp är alltså i princip liktydigt med att definiera ett schema, bara det att gränssnittet i Google Base är betydligt enklare än i de flesta XML-redigeringsprogram. Däremot får man inte ut något schema, utan informationstypen lagras bara hos Google…
När man valt (eller skapat) en informationstyp får man fylla i formulär för att publicera sin information. Men det går även att automatisera uppladdning av befintlig information, genom att t.ex. hänvisa Base till en RSS-feed som innehåller informationen man vill publicera.

Paradigmskifte?
Det som gör Google Base till ett potentiellt paradigmskifte för strukturerad information är nätverkseffekten. De informationstyper som många människor väljer att använda presenteras automatiskt högt upp i listan med föreslagna informationstyper. Tack vare att Google är så stora kommer detta sannolikt att leda till att mängder av olika informationstyper (scheman) kommer att uppstå, och de som många människor är intresserade av att använda har förutsättning att bli de facto-standarder!

Istället för att förhandlingar inom branschorganisationer avgör hur ett schema för branschen ska se ut finns här förutsättningen för snabb, organisk framväxt av gemensamma informationstyper. Detta gör att många fler nicher kommer att få gångbara informationstyper.

En sådan organisk framväxt har flera fördelar:

  • Snabbt
  • Fokuserar på det som verkligen används
  • Survival of the fittest istället för politiska kompromisser

Men det finns nackdelar också:

  • Snabbhet går före klokhet
  • Alla data huseras av ett företag
  • Minoriteters behov kommer i andra hand (t.ex. språkminoriteter)
  • Hur blir det med kompatibilitet och öppna standarder?

Innehållet är taggat med:

Författare:

En kommentar till artikeln

Kommentarer

  1. En variant av denna text publicerades den 23/11 i Computer Sweden.