GradientTop
PC
Vodeći IT časopis u Srbiji
PC #178 > Projekat
ARHIVA BROJEVA | O ČASOPISU | POSTANI SARADNIK | PRETRAGA
preview
Svaka čast Gutenbergu, ali...
Voja Antonić
Milioni knjiga čekaju da budu digitalizovani i dostupni svakome ko poželi da zaviri u njih. Kako brzo skenirati čitavu biblioteku? Predstavljamo efikasno rešenje sa jednim robotizovanim nosačem i dva foto-aparata.
- PC #178 u prodaji po ceni od 110 din
broj

Svaka čast Gutenbergu, ali...

Standardni flatbed skeneri su dobro rešenje za digitalizaciju sadržaja na papiru, ali svako ko je bar jednom skenirao knjigu na ovaj način zna o kolikom se poslu radi. Skeniranje prosečne knjige traje satima, a stranice treba otvoriti za 180 stepeni i knjigu dobro pritiskati po sredini, što ne može da prođe bez oštećenja.

Ništa bez kompromisa

(kliknite za veću sliku)

Do sada je razvijen niz sistema za brzo skeniranje knjiga. Rekorder u brzini je uređaj koji superbrzom kamerom snima knjigu koju operater, u vremenu koje se meri sekundama, „pretrči“ kao kada tražite papirić zaturen između stranica. Laserski osvetljivač na tako otvorene stranice emituje mrežu koju softver koristi da bi naknadno „ispravio“ deformacije nastale zbog snimanja iskrivljenih stranica. Ovakav skener omogućava zavidnu brzinu od 200 stranica u minutu, ali tako brze kamere imaju rezoluciju od samo 1 Mp, pa je kvalitet snimaka nizak, optičko prepoznavanje teksta je moguće samo ako je font veliki. Knjiga koju je konstruktor uređaja koristio tokom demonstracije ima samo 17 redova teksta po stranici i to je verovatno maksimum koji može da se postigne.

Za uspešno digitalizovanje knjiga treba pronaći kompromis između brzine i kvaliteta. Ovo se u praksi postiže uređajima koji knjigu „skeniraju“ pomoću jednog ili dva foto-aparata visoke rezolucije. Ove skenere ćemo najlakše analizirati ako ih grubo podelimo u tri grupe. Najsloženiji su oni koji imaju neku vrstu robotske ruke koja, pneumatski ili elektrostatički, okreće stranice. Na prvi pogled ovo je najbolje rešenje jer ne zahteva ljudsku asistenciju tokom skeniranja, ali su takvi sistemi spori, a i probirljivi po pitanju kvaliteta papira – oni ne mogu uspešno da manipulišu potpuno novim ili veoma starim knjigama.

Ručni skeneri knjiga rade tako što operator za svaki par stranica jednom rukom podigne providni pritiskač (koji je neophodan da bi rezultat bio upotrebljiv za pouzdano prepoznavanje teksta), a drugom okrene stranicu, pa ponovo spusti pritiskač. Posao je zamoran, jer za svaku knjigu treba nekoliko stotina puta podići i spustiti velike staklene površine. Kompromis između ova dva rešenja je poluautomatski skener, sa motorom koji automatski podiže i spušta pritiskač, a od operatora zahteva da ručno okreće stranice. Ovo rešenje je primenjeno u projektu koji je upravo završen i koji ovde opisujemo.

...a uz to i radi

Detalj rasklopljenog mehanizma pritiskača
(kliknite za veću sliku)

Uređaj je koncipiran po V‑shaped sistemu, kod koga se knjiga nalazi u držaču sa dve ploče postavljenje pod uglom od 90 stepeni, uz dva jednaka foto-aparata koji istovremeno snimaju parnu i neparnu stranicu. Ovo je veoma pogodan položaj za sve knjige, počev od potpuno novih pa do najstarijih, vrednih izdanja, jer ne zahteva da se listovi puno savijaju prilikom skeniranja. Pritiskač je istog oblika, od pleksiglasa, koji ima dobru osobinu da nije težak kao staklo, ali zahteva često čišćenje antistatičkim sredstvom.

Podizanje pritiskača je rešeno kliznom šinom sa linijskim kotrljajućim ležištem (kolica koja na kuglicama precizno plivaju po kanalima masivne šine), a za pogon je upotrebljen koračni (stepper) motor sa pogonim preko zupčastog kaiša, koji pritiskač „gura“ nagore (na prvoj slici je u gornjem položaju), a kada je u donjem (za snimanje), dozvoljava mu da stranice knjige pritiska samo svojom težinom. Time je omogućena potpuna kontrola brzine kretanja pritiskača, sa „mekim“ startom i zaustavljanjem, ali zahteva poseban kontroler, što komplikuje elektronski upravljački sklop.

Srećna je okolnost što danas imamo na raspolaganju jeftine foto-aparate rezolucije preko 10 megapiksela, pa čitav projekat može da se realizuje iz kućnog budžeta. Ovde su upotrebljena dva aparata Canon A480, odabrana kao najjeftinija iz kategorije koja podržava daljinsko okidanje.

Za pouzdano i stabilno snimanje neophodna je robustna i teška mehanička konstrukcija. Primenjeno je jednostavno i solidno, a opet jeftino rešenje, sa pločama od oplemenjene univer iverice, koju mnoge firme precizno seku po meri i kantuju (lepe ivičnu plastičnu traku). Treba reći da komplet od 15 drvenih komponenata (isečenih po vašim dimenzijama) za konstrukciju ukupnih dimenzija 72×45×60cm, sa pokretnim držačem knjige i dva nosača fotoaparata, nije koštao više od 3.000 dinara, mada su delovi obloženi luksuznim ABS trakama.

Uređaj ipak nije jeftin. Posle foto-aparata, najveći izdatak su komponente mehanizma za podizanje pritiskača, ali je za mene srećna okolnost bila ta što sam već imao na raspolaganju linijska kotrljajuća ležišta, koračne motore i mikroprocesorske kontrolere preostale od ranijih projekata. Tako sam problem zahtevnijih delova rešio „iz fioke“, bez novih ulaganja i čekanja na isporuku.

Za dobre rezultate, treba posebno rešiti i rasvetu. Ovde nikako ne treba računati na okolne izvore svetla, nego ih, naprotiv, treba eliminisati „šatorom“ od crnog platna (koji se na priloženim slikama ne vidi), a izvore svetla postaviti tako da ne stvaraju refleks na površini pritiskača. U ovom slučaju, upotrebljeno je 12 belih svetlećih dioda snage po 1 W. Radi hlađenja i usmeravanja svetla ka stranicama knjige, montirane su na unutrašnju površinu aluminijumskih U‑profila.

Pokretni delovi

Podešavanje horizontalne pozicije foto-aparata
(kliknite za veću sliku)

Opisani skener može da se koristi za knjige od najmanjeg pa sve do formata A4, ali je važno da se osa objektiva uvek poklopi sa osom upravnom na centar stranice knjige. Zbog toga treba omogućiti podešavanje pozicije foto-aparata po obe ose, kao i rotiranje za precizno kadriranje stranica. Kao najjednostavnije rešenje iskorišćena su dva fotografska stativa („tripoda“) kojima se jednostavno odseče gornji deo sa liftom (za pomeranje gore‑dole) i rotacionim delom za X‑Y kadriranje. Noge stativa ne treba baciti, jer se mogu upotrebiti za nosače crnog „šatora“, tako da čine četiri vertikalne ugaone šipke kojima se drži platno.

Time je rešeno podešavanje pozicije po Y osi i rotacija X‑Y, a ostalo je još odgovarajuće podešavanje po X‑osi. Zbog toga su glave stativa postavljene na dve drvene kutije koje mogu da se kreću napred‑nazad i da se fiksiraju velikim navrtkama za glavno postolje uređaja. Sve ovo daje dovoljnu čvrstinu i robusnost nosačima foto-aparata i omogućava savršenu stabilnost njihove pozicije.

Držač knjige mora da se pokreće levo‑desno, jer se providni pritiskač uvek spušta na istu poziciju i time omogućava stabilan položaj vidljivih stranica, a to znači da knjiga tokom listanja mora da se pomera, jer na početku ima debeli sloj stranica na desnoj strani, a na kraju na levoj. Jednostavan klizni sklop sa tankim pločama, koje se vide na prvoj slici, omogućavaju da se nosač kreće linearno, jer je srednja pločica (u obliku izlomljenog slova V) pričvršćena na nosač knjige i prelazi preko glavnog postolja, a dve manje pločice su fiksirane za postolje i prelaze preko nosača knjige. Isti sistem je primenjen i za horizontalno podešavanje pozicije nosača foto-aparata.

Elektronski sklop

Elektronski sklop sa ispravljačem, kontrolerom i interfejsom
(kliknite za veću sliku)

Prilikom projektovanja mehaničkog sklopa, u zadnjem delu je ostavljen prostor dimenzija 27×23×7 cm za elektroniku, ali se ispostavilo da u taj prostor jedva staje sve što je potrebno. Na slici se vidi da bi malo manje kućište za elektroniku bilo nedovoljno: u desnom delu je napajanje 5/24 V snage 60 W, a iznad motora je glavni kontroler (od nekog ranijeg projekta) i u vrhu je ploča sa dodacima. Tu su stabilizatori za napajanje foto-aparata, koji, sudeći po specifikaciji, treba da rade na 3,2 V, ali stabilizatori s tim naponom ne postoje kao standardni delovi, pa umesto toga sasvim dobro rade stabilizatori za 3,3 V, montirani na hladnjake. Tu je i niz otpornika kojima se reguliše struja za LED rasvetu, jer je u kratkom trenutku tokom snimanja glavno svetlo uključeno punom snagom, a tokom okretanja stranice i pokretanja pritiskača jačina se, zbog prijatnijeg rada, smanjuje na jednu trećinu.

Kontroler je na sebi već imao serijski port, koji se prilikom razmeštaja pločica sam „namestio“ uz ivicu kućišta, pa je bilo logično napraviti izrez za pristup ovom portu. Možda će se u nekom kasnijem proširenju uređaja ukazati potreba da se direktno sa računara upravlja radom skenera ili da se podešavaju njegovi parametri.

Dodat je i interfejs za daljinsko okidanje foto-aparata, koji ispunjava pomalo neobične zahteve. Naime, na ovim foto-aparatima ne postoji priključak za komandu daljinskog snimanja, nego se to rešava tako što se na USB priključak kratkotrajno dovede napon od 5 V. Kao i velika većina foto-aparata, i ovaj ima USB priključak, ali on ne koristi napon od 5 V (koji USB standard inače nudi) za napajanje, pa se grupa entuzijasta dosetila kako da prisustvo ovog napona iskoristi za komandu daljinskog snimanja. Ta komanda, inače, ne postoji na foto-aparatu kada ga kupite, pa morate da instalirate softverski upgrade.

Šta je CHDK?

CHDK je softverski plug‑in za postojeći firmver, koji velikom broju Canon foto-aparata donosi na desetine novih funkcija. Teško bi bilo nabrojati ih jer se u meniju za podešavanje nalazi preko sto opcija, ali ćemo pomenuti samo mogućnost da se napiše program u bejziku koji će sve resurse držati pod kontrolom.

Nas ovde zanima samo mogućnost daljinskog okidanja preko pomenutog napajanja iz USB porta. Zbog ovoga moramo da koristimo CHDK, ali pošto nije moguć običan upgrade firmvera, postoji poseban postupak kojim se on upiše na SD karticu, pa se omogući boot sistema sa kartice i na kartici se uključi prekidač za zabranu upisa. Tek tada će se operativni sistem foto-aparata „podići“ sa kartice, ali se još neće koristiti novi firmver, jer za to treba u prvoj sekundi po uključivanju pritisnuti taster Mode i tek tada će se u dnu displeja pojaviti oznaka <ALT>, kao znak da ste u alternativnom operativnom sistemu CHDK. Zabrana upisa na kartici neće predstavljati problem za upis fotografija tokom snimanja, jer CHDK zna kako da zaobiđe ovu zabranu.

Performanse i modovi rada

Ovakvim skenerom je moguće postići brzinu od oko 5 sekundi za par stranica. Za prosečnu knjigu od 300 stranica potrebno je, dakle, oko 13 minuta. Rad nije preterano naporan (mada se ne može reći ni da je zanimljiv), jer treba samo okretati stranice i prtiskati taster za snimanje. Operater vrlo brzo nauči kako da okreće stranice dok je pritiskač samo napola podignut, pa može da postigne i veću brzinu.

Jedini ozbiljan problem koji je primećen jeste nemogućnost preciznog zumiranja, jer mali foto-aparati za porodične fotografije imaju relativno brz motor zuma, pa je teško podesiti ga prilikom kadriranja. Uz malo veštine i iskustva i ovaj problem može da se ublaži, ali je jedino pravo rešenje upotreba kvalitetnijih foto-aparata koji imaju ručno podešavanje zuma.

Ako se skenira knjiga formata A4 (210×297 mm), sa rezolucijom od 10 megapiksela se postiže više od 300 DPI. Sa manjim knjigama, rezolucija po inču je još viša. Za skeniranje većih površina, kao što je dnevna štampa, treba koristiti višu (i neuporedivo skuplju) klasu foto-aparata, koji imaju rezoluciju od oko 22 megapiksela.

Čitav sistem može da radi u on‑line režimu (u kome se posle svakog snimka JPG fajlovi „pakuju“ preko USB porta na hard disk kompjutera) i off‑line, kod koga se sve beleži na SD karticu i kasnije prepisuje na hard disk kompjutera. Dalja obrada takvih snimaka je stvar specijalnog besplatnog softvera, koji je u više verzija dostupan na Internetu.

Korisne adrese:

DIY Book Scanning
http://www.diybookscanner.org

SLEDEĆI TEKST U PC #178
preview
Širi projektantski vidici
Đorđe Grujić


.

PC
Twitter Facebook Feed Newsletter