Sectorul CIVES
 
 

Backup pentru istorici si nu numai

Dedicat discutiilor despre "Procesul comunismului, contrarevolutiei si tranzitiei criminale" si lansarii unor proiecte de tip stand de prezentare, sinteza problematica sau forum

Backup pentru istorici si nu numai

Mesajde Marius Delaepicentru » Mie Apr 13, 2005 5:36 am

Plec de la premiza ca informatiile pe care le va detine CNSAS nu mai sunt secrete. Arhiva Secu trebuie făcută publică, şi pusă pe Internet. Secu, pardon, SRI nu pare dispus să dea şi opis-urile. Lucru care face imposibilă exploatarea arhivei. Forma JBOF (just a bunch of files) este obstacolul.

Cu, sau fără opis, originalele trebuie fotocopiate. Am o idee de model de prelucrare. Presupun ca sunt texte greu lizibile, nu toate dactilografiate. Pentru prelucrări de felul acesta, programele OCR de digitizare a informaţiei, mai mult încurcă automatizarea prelucrării fotocopiilor.

Practic, ideea mea consta in folosirea voluntarilor la fotocopierea paginilor din dosarele fostei Securitati, urmata de intocmirea instrumentelor de cautare, tot cu voluntari.


In linii mari, proiectul pe care vi-l propun, are ca obiectiv intocmirea unei baze de date, prin tehnica SETI, DEX-on-line, Gutenberg project, sau cum vreţi să-i ziceţi, tehnicii prelucrarii distribuite a datelor.

Pe scurt, fazele sunt:
1. Scanarea
2. Distribuirea paginilor si extragerea manuala a cuvintelor cheie.
3. Stringerea cuvintelor cheie si verificarea calitatii compilatiei.
4. Intocmirea index-ului de cautare.
5. Exploatarea bazei de date.

Cum se face? Descriu mai jos fazele în care voluntarii au un rol crucial.

Faza 1., care este si locul ingust al fluxului, presupune prelucrarea primara. Asta inseamna sali de scanare in Bucuresti, pentru cazul "centralizat", si in orasele importante, pentru cazul "cu distributie limitata", sali in care intra numai voluntari instruiti, ce au ca singura operatie, scanarea dupa un protocol unic, si salvarea fisierelor crude in folderele alocate. Numai in arhiva Secu sunt circa 200 milioane de pagini, dupa socotelile mele. Foarte putine pagini pot fi prelucrate cu programe OCR. Numai pentru scanare, volumul de munca estimat este de 3 pina la 10 milioane de ore om. Cu o mie de aparate de scanare, lucrind teoretic 2000 de ore pe an, si cu un factor real de utilizare de 0,7 s-ar putea fotocopia intreaga arhiva, in 2 pina la 7 ani. Volumul de date estimat este intre 20 si 60 de Teraocteti, la 100-300 KB per pagină fotocopiată. Sa-l denumim bazinul amorf.

Fazele 2. şi 3. merg in paralel cu faza 1., si aici trecem la extragerea cuvintelor semnificative, cu ajutorul voluntarilor ce pot fi raspinditi in toata Lumea. Iata cum. Programul-mama trimite fiecarui client cite o pagina aleasa la intimplare, din bazinul amorf. Clientul, cind are timp, extrage cuvintele cheie cum ar fi antroponimele, toponimele si numele de organizatii economice, apoi le scrie in rubricile de pe interfatza grafica a micului program-client pe care-l instaleaza atunci cind consimte sa participe la proiect. Incarca apoi cu un simplu clic cuvintele extrase, in setul de date atribuit fiecarei pagini. Voluntarii din faza a 2-a nu vor vedea decit pagini fara legatura intre ele, repartizarea fiind aleatorie, iar singura lor treaba este sa faca operatia simpla de "recoltare". Rutina poate fi repetata ori de cite ori este nevoie. Cu alte cuvinte, programul-mama, compara după o schemă logică, cele doua sau mai multe seturi de cuvinte cheie corespunzătoare fiecarei pagini, iar atunci cind diferentele sunt flagrante, trimite pagina cu pricina spre alti clienti, pina cind setul de cuvinte se stabilizează. Pagina ce trece "examenul" de reproductibilitate este promovata automat, in bazinul structurat, adica in baza de date definitiva, cu motor de cautare, cu tot dichisul.

In viziunea mea, cu proiectul, odata definitivat, bazinul structurat ar trebui sa fie accesibil oricui, fara taxe si cereri, aprobari, parafe sau prezentza fizica a celui ce cauta. In felul acesta cred ca amnezia de care suntem bintuiti poate fi combatuta cu succes, istoricii vor fi mai feriti de boli profesionale, for putea consulta sursele chiar de-acasa. Insusi voluntariatul are o valoare educativa, pe linga interesul pentru trecut pe care-l intretine in voluntari proiectul in sine.

Pe linga codeala SRI, o singura problema majora vad. Nici o organizatie nu actioneaza intru anularea propriei ratiuni de existentza. Iar proiectul de dare in exploatare a arhivelor Securitatii, odata finalizat, CNSAS va trebui desfiintat.
Acum, daca este sa evaluam costurile, o evidentza ca vai de ea, si un CNSAS birocratizat in mod obtuz, guvernat de spiritul notarial al stampilei si-al ghiseului, o organizatie cu o sperantza de viata de 25-30 de ani, daca nu eterna, cred ca ar costa cu mai mult decit proiectul in echipa informala, propus de mine. Cine se-ncumeta?
Marius Delaepicentru
 
Mesaje: 2
Membru din: Mie Apr 13, 2005 4:02 am

Mesajde Marius Delaepicentru » Lun Iul 25, 2005 1:42 pm

Are cineva o listă cu activiştii PCR de rang înalt (bine ar fi si mediu) şi, eventual date biografice actualizate?
Marius Delaepicentru
 
Mesaje: 2
Membru din: Mie Apr 13, 2005 4:02 am

VIP uri din comunism enciclopedie 2 vol germana

Mesajde Dan Culcer » Joi Sep 22, 2005 3:19 pm

Exista o enciclopedie in germana, cred, aparuta prin 1975 in doua tomuri, care contine toate persoanele care au avut functii de partid, de stat, in presa.
La Paris, in biblioteca Centrului Pompidou, al rasfoit cartoiul pe vremuri.
Pina si numele meu, ca redactor sef adjunct la Vatra, de scurta durata e drept, figura. Treaba nemteasca. Din pacate nu am notat atunci titlul.
Dan Culcer javascript:emoticon(':roll:')
"Cerul deasupra-ti schimbi
Nu sufletul marea tracînd-o."
Horatiu tradus de Eminescu
Dan Culcer
 
Mesaje: 8
Membru din: Joi Dec 23, 2004 3:36 pm
Localitate: France

Mesajde Sonia Doris » Mie Feb 01, 2006 11:25 pm

dar in Romania, ar putea avea cineva (fara functie sau buzunar generos) acces la asa ceva?
If you plan, the day is boring. (Freddie Mercury)
Sonia Doris
 
Mesaje: 2
Membru din: Mie Feb 01, 2006 11:15 pm
Localitate: intre Cluj si Tg. Mures

Lista cu activistii PCR de rang înalt

Mesajde Dan Culcer » Dum Feb 05, 2006 11:06 pm

Are cineva o lista cu activistii PCR de rang înalt (bine ar fi si mediu) si, eventual date biografice actualizate?
In Romania, am aflat ca s-a editat o carte chiar de catre CNSAS cu membrii CC
Va sfatuiesc sa mai cautati pe Google, unde se afla multe/
Cu bine, Dan Culcer

Membrii C.C. al P.C.R. 1945-1989. Dic?ionar,
Florica Dobre (coord.), Liviu Marius Bejenaru, Clara Cosmineanu-Mare?, Monica Grigore, Alina Ilinca, Oana Ionel, Nicoleta Ionescu-Gur?, Elisabeta Neagoe-Ple?a, Liviu Ple?a, Bucure?ti, Editura Enciclopedic?, 2004, 662 p.
 
Rod al muncii de investiga?ie în diverse arhive pe parcursul mai multor ani, dic?ionarul membrilor C.C. al P.C.R. realizat de cercet?torii C.N.S.A.S. se constituie într-un extraordinar instrument de lucru pentru orice istoric contemporaneist, dar ?i într-o vast? surs? de informa?ii pentru cititorii dornici s? ?tie mai mult despre pseudo-elita politic? a României comuniste.
De?i negau cu t?rie rolul personalit??ilor în istorie, atribuind maselor ?i luptei de clas? sarcina de ?motor al istoriei?, regimurile comuniste s-au dovedit creatoare a unui cult al personalit??ii f?r? precedent în istoria modern?. Dincolo de ?Genialul Cârmaci? se aflau îns? micii satrapi locali, a c?ror putere de a face bine ?i r?u (dar mai ales r?u!) se dovedea adesea nelimitat?. Unul din membrii C.C., inclu?i în dic?ionar, Alexandru B?rl?deanu, nu ezita s? afirme într-un interviu din anii ?90: Nu ?ti?i ce autoritate aveau înainte în ?ar? instructorii veni?i de la C.C.! ??tia erau Dumnezei pentru regiuni!.
A?adar, cine dore?te s? ?tie mai multe despre ace?ti ?Dumnezei? ai panteonului comunist, le poate afla sinuoasele cursus honorum prin parcurgerea datelor adunate cu acribie între copertele acestui dic?ionar. Autorii au structurat informa?ia pe urm?toarea gril?: nume ?i prenume, data ?i locul na?terii/decesului, na?ionalitatea, studii, profesia de baz?, activitatea ?i func?iile de?inute, distinc?ii. Fi?ele membrilor C.C. sunt precedate de un studiu introductiv de nu mai pu?in de 59 pagini, semnat de Nicoleta Ionescu-Gur?, studiu ce reu?e?te o bun? familiarizare a nespeciali?tilor cu problematica extrem de complex? presupus? de investigarea regimului comunist.
În încheiere, chiar dac? dic?ionarul are câteva ?pete albe? (la unele persoane fiind trecute doar numele ?i data la care apar men?ionate ca membru al C.C.), consider?m c? lucrarea este de neocolit pentru oricine studiaz? regimul comunist din România.
"Cerul deasupra-ti schimbi
Nu sufletul marea tracînd-o."
Horatiu tradus de Eminescu
Dan Culcer
 
Mesaje: 8
Membru din: Joi Dec 23, 2004 3:36 pm
Localitate: France


Înapoi la Discutii generale, probleme semnalate, incubator de proiecte

Cine este conectat

Utilizatorii ce navighează pe acest forum: Niciun utilizator înregistrat şi 8 vizitatori

cron
<<< Piata Universitatii 2009