All books ever written – än sen då?

Som jag sa till min kollega Erika när hon ringde och ville prata Google inför bokmässan och det seminarium som skulle hållas där om Googles bokambitioner förra månaden – jag är inte alls övertygad om att bokförlagen åtminstone i ett kortare perspektiv har så mycket att frukta från Google Books, eftersom Google tvärtom vad många tror inte alls är superframgångsrika på alla områden de ger sig in på. Tvärtom är de ofta rätt taffliga. Och det har förekommit rätt många indikationer på att den här massiva inscanningen av i dagsläget 15 miljoner böcker de gjort inte håller måttet rent kvalitativt.

Och i dag såg jag via Adam Gardefjord ett alldeles lysande och samtidigt väldigt nedslående exempel på just det. Sir Arthur Conan Doyle torde snurra ett par varv i sin grav om någon ger honom länken till artikeln. Att säga att Googles inscanning av hans ”The parasite” är undermålig är närmast att linda in sanningen när man ser resultatet, och om jag förstått saken rätt är det här inte ett undantag, utan snarare en regel på hur kvaliteten ofta ser ut.

Troligen kommer det väl inte att se så här amatörmässigt ut när de ska börja sälja nya e-böcker i sin butik Google Editions, men det visar ändå hur oerhört långt ifrån konsumenter och i det här fallet läsare som Googles datatekniker befinner sig.

6 reaktioner till “All books ever written – än sen då?”

Petra skriver:

13 oktober 2010 kl. 13:14

Hej!
Vill bara tipsa om att vi instiftat ett nytt litteraturpris, Bokbloggarnas litteraturpris! Alla med bokblogg är välkomna att nominera till det. Läs mer här:
http://www.breakfastbookclub.se/2010/10/11/bokbloggarnas-litteraturpris/

Hoppas du vill vara med och nominera och rösta fram bokbloggarnas val av årets bok 2010.

Priset kommer delas ut på Stora Kulturbloggprisets gala 27 november.
Hans Persson skriver:

13 oktober 2010 kl. 15:02

Vad det gäller scanningskvalitet så är det bara att hålla med artikeln; Google slarvar.

Däremot har han fel om mycket annat. Google gör helt rätt som scannar alla sidor av verket inklusive titelsidor, innehållsförteckningar och annat. De vet inte hur någon annan vill använda verket, så det enda raka är att ta med allt. Projekt Runeberg gör likadant (men med bättre kvalitetskontroll).
Daniel Åberg skriver:

13 oktober 2010 kl. 22:48

Visst, håller med om att de inte kan utesluta vissa sidor ur originalet, däremot finns det ju ofantligt mycket mer de borde ha kunnat göra med materialet för att underlätta läsningen av det. Och det finns ju en gräns för när en dåligt avscannad bok inte är bättre än ingen avscanning alls. Ska bli intressant att se om det här leder till någon vidare granskning av hur kvaliteten på projektet som stort ser ut.
Geir skriver:

13 oktober 2010 kl. 23:15

Merkelig kommentar. Googles kvalitet på scanningen er høy. Det ser du når du laster ned pdf-versjonen. Bloggartikelen du lenker til har misforstått alt. Den blander sammen kvaliteten på scanningen og googles automatiske konvertering til epub. Det er klart at datagenererte epuber baserte på OCR av gamle bøker ikke vil ha særlig høy kvalitet, og det er meningsløst å kritisere disse som om de skulle ha vært laget av tenkende mennesker.
Daniel Åberg skriver:

13 oktober 2010 kl. 23:32

Geir: Är det mitt inlägg som är märkligt eller originalinlägget med Conan Doyle och Reader store? Förstår inte riktigt vilket du syftar på.

Hur som helst – oavsett om kvaliteten på själva inscanningen skulle vara hög så är det högst märkligt att Google släpper ut filer på marknaden, vilket de ju uppenbarligen har gjort eftersom boken införskaffats via Reader store, där inscannarens fingeravtryck plötsligt dyker upp. Att det dessutom sker i en epub-fil, där åtminstone jag tänker mig att det endast borde förekomma text, är extra märkligt. Det tycker inte jag tyder på särskilt högt kvalitetstänkande gällande helheten, och jag tycker heller inte att det är konstigt att man kritiserar det.
Geir skriver:

15 oktober 2010 kl. 16:19

Filene er generert automatisk av datamaskiner som ikke klarer å skille mellom et relevant bilde og et fingeravtrykk i scanneprosessen når det avgjøres hva som skal viderføres til epub filen. Jeg tror det fleste er glade for at det tas med for mange heller enn for få bilder. Poenget som både du og bloggeren du lenker til overser er at det ikke er noen menneskelig kvalitetskontroll av disse filene og at det heller ikke er ment å være det (og av konstandsmessige hensyn heller ikke kan være det).

Kommentarer är stängda.