GradientTop
PC
Vodeći IT časopis u Srbiji
PC #145 > Softver
ARHIVA BROJEVA | O ČASOPISU | POSTANI SARADNIK | PRETRAGA
preview
Digitalizacija radio arhive
Branislav Jugović
Kulturnu baštinu koja se sastoji od više miliona minuta tonskih snimaka treba prebaciti u digitalnu formu. Kako su stručnjaci odgovorili na ovaj izazov?
- PC #145 u prodaji po ceni od 110 din
broj

Digitalizacija radio arhive

Radio Beograd (www.radiobeograd.rs ) je jedna od naših najznačajnijih ustanova. Ne samo zato što je deo medijskog javnog servisa RTS-a, već što je daleko više od državne radio stanice. Ta naša kuća je inače poznata po mnogim nagradama i priznanjima koja su širom sveta dobijali njeni stvaraoci i tehničari. Pomenimo samo već tradicionalno visok kvalitet rada novinara, dramaturga, tonskih snimatelja...

Mediji i kolekcija

Obimne arhive „Radio Beograda“ sadrže kulturno-istorijsko blago od neprocenjivog značaja. Još od formiranja radija 1924. godine, počelo se sa prikupljanjem raznovrsnog materijala, i to ne samo zvučnih zapisa. U arhivi „Radio Beograda“ čuva se blizu 60.000 sati tonskih snimaka na 150.000 nosača zvuka (fonoteka i tonska arhiva), više od 5 miliona (!) novinskih isečaka (hemeroteka), oko 35.000 raznovrsnog notnog materijala (nototeka), biblioteka (osnivač Stanislav Vinaver), fotodokumentacija, veliki broj raznovrsnih novina i veoma obimna poslovna dokumentacija još uvek neutvrđenog broja strana.

Zanimljivo je da hemeroteku, pored zaposlenih na beogradskom radiju, većinom koriste autori dokumentarnih TV emisija i filmova, nalazeći u njoj davno zaboravljene informacije kojih nema ni na jednom drugom mestu. Da, ipak ipak nije sve na Internetu...

Radi lakšeg rada, povezivanja informacija, saradnje raznih službi unutar kuće, ali i spasavanja materijala koji je načet zubom vremena, neophodno je celokupnu arhivu prebaciti u digitalni oblik. Tako obiman posao zahteva velike kapacitete, vrhunsku tehniku, stručnjake i organizaciju. Usled specifičnosti zadatka i osetljivosti materijala, sav posao će biti obavljen unutar „Radio Beograda“. Tim će se sastojati od 40 ljudi, a proces će trajati godinama.

Od zvuka do baze

Naš sagovornik na tu temu je dipl. inž. elektrotehnike Vladimir Milićev, stručnjak za akustiku i informatiku u „Radio Beogradu“ i kontakt-inženjer za Euroradio.

- Naš arhiv kreće u proces digitalizacije uz pomoć sredstava dobijenih od Nacionalnog investicionog plana na zvaničnom konkursu. Nabavićemo savremenu opremu za skeniranje knjiga, dokumenata i prebacivanje fonoteke u digitalni oblik. Jedan skener za dokumente košta nekoliko desetina hiljada evra, a skener za knjige daleko više. Za sada raspolažemo sa oko 250.000 evra, verovatno će nam zatrebati i više. Predsednik komisije za digitalizaciju arhiva je PR „Radija”, pomoćnik direktora Branka Vuković. Ja sam zadužen za tehnički deo posla.

Naša fonoteka, pored magnetofonskih traka i gramofonskih ploča, poseduje i zvučne zapise na namagnetisanim žicama i papirnim magnetofonskim trakama. Govorni snimci i radio drame su u posebnoj, tzv. tonskoj arhivi. Usled velikog broja dokumenata i snimaka, proces digitalizacije će se odvijati na više paralelnih linija. Trajni snimci (fonoteka) će se prebacivati korišćenjem nekoliko magnetofona i gramofona, Lynx ili RME zvučne karte, AKG slušalica i Tannoy monitora, kaže Vladimir Milićev.

S obzirom na loše stanje jednog dela fonoteke, da li će se raditi remastering snimaka?

Naravno. Prvo se digitalizuje ono što je u najlošijem stanju. Još se pouzdano ne zna otkad datiraju najstariji snimci, ali imaju preko 70 godina. Ima starih snimaka sa dosta smetnji i one se moraju otkloniti ručno. Tu ne pomažu automatski procesi jer takvi snimci zahtevaju pažljiv pristup, u kome se ništa ne prepušta slučaju. Rad je dug i mukotrpan, ali unikatnost mnogih takvih snimaka opravdava toliki trud. Ti snimci se posle dodatno obrađuju – frekvencijski i dinamički.

Na kojim medijima će se čuvati buduća arhiva?

- Planira se HDD storage za celokupnu arhivu i rezervnu kopiju, a za fonoteku i CD Audio format. Preporuka EBU (European Broadcasting Union) je da se fonoteka skladišti na hard disku kao WAV fajl atributa 48 kHz frekvencije odabiranja sa 16 ili 24 bita po odbirku. Na CD Audio disku je naravno CDA fajl format od 16 bit/44,1 kHz. Materijal se trenutno arhivira na dva medija – na magnetofonskim trakama i na CD-ovima u CD Audio formatu.

Koji programi će se koristiti pri tome?

Kada je u pitanju fonoteka, snimanje će se vršiti korišćenjem programa Audacity...

Postoje daleko razvijeniji programi?

Radim na sopstvenim programskim rešenjima, od kojih će se neka koristiti i u „Radio Beogradu“, pa znam da je algoritam za snimanje svuda isti. Audacity bi se koristio samo za sam proces snimanja. Kada snimimo materijal koristeći Lynx zvučne karte, kasniji rad sa njim je druga priča; tada je već bitno sa čim se radi. Za obradu i restauraciju ćemo koristiti hardversko-softverski sistem ProTools, pojačan već poodavno najboljim rešenjem za restauraciju snimaka, a to je CEDAR. Time obezbeđujemo maksimalni kvalitet jer su ta dva sistema svetski standard za ozbiljan rad sa digitalnim audio signalom.

Kako će biti organizovano pretraživanje tako velike arhive i da li će se pri tom koristiti neka od postojećih rešenja za upravljanje bazom podataka?

Biće korišćen moj softver, uz pomoć nekih gotovih programskih modula napravljenih specijalno za ovakve namene. Služiće za unos i pretragu podataka (digitalizovanih fajlova i odgovarajućih metapodataka) i urađen je u Microsoft Visual Studio okruženju, u programskom jeziku C#. Prvobitna varijanta bila je urađena u Matlab-u, ali sam se zbog podrške Microsoft-a, kao i zbog nekih stvari u vezi s brzinom rada ipak opredelio za C#. Naravno, to je veliki i složen zadatak, ali sam uspeo da nađem pravo rešenje primenjivo na sve vrste podataka. Smatram da sam objedinio maksimalnu funkcionalnost i jednostavnost korišćenja. Pretraga je dubinska, sa mogućnošću pretpregleda, direktnim slanjem materijala na potrebno mesto i slično.

Da li vam je pisanje tog softvera bio radni zadatak ili ste krenuli u taj posao samoinicijativno?

Nije bio radni zadatak. Radio sam samoinicijativno i samostalno.

Hoće li biti moguće pretraživati dokumentaciju i po sadržaju, tj. tekstualno, a ne samo koristeći metapodatke?

Naravno. To je bila moja ideja od samog početka i smatram da će umnogome olakšati korišćenje digitalizovane arhive. Rezultati skeniranja će se čuvati u PDF formatu. Dokumenti će se OCR-ovati. Ja sam uradio i implementirao u glavni program jednostavan OCR alat koji je dobar za manje zahtevne zadatke. Za ostale će se koristiti dodatni spoljni softver. Iole komplikovaniji slučajevi će morati da se rade pažljivo, kontrolisaće se i ispravljati rezultati rada OCR-a. Sa istom pažnjom s kojom se pristupa restauraciji zvučnih zapisa, pristupiće se i pretvaranju fajlova nastalih skeniranjem u tekst. Razlog je loše stanje dela dokumentacije, gde će i najbolji OCR alati imati velikih problema, uprkos pomoći čoveka.

Kako stoji stvar sa povezivanjem podataka sa nekim drugim ustanovama od nacionalnog značaja i da li će ovo naše blago biti dostupno i preko Interneta?

U svrhu povezivanja sa Narodnom bibliotekom Srbije koristiće se program Cobiss. U njemu je rađena katalogizacija (ne i digitalizacija) knjiškog fonda u NBS. Prenošenje sadržaja knjiga u elektronski oblik je posebna priča.

U početku će arhiva biti dostupna samo u okviru interne mreže. Planira se i dostupnost preko Interneta, gde će se korišćenje nekih sadržaja naplaćivati. Pristup novinskoj arhivi bi trebalo da bude delimično besplatan, a postoji mogućnost da fonoteka bude reprezentovana kratkim isečcima. U svakom slučaju, potpun pristup će se omogućiti samo posebno registrovanim korisnicima.

SLEDEĆI TEKST U PC #145
preview
Na kraju sveta
Vesna Milošević


.

PC
Twitter Facebook Feed Newsletter