Zamanında ne çok uğraşmıştık. PubMed'in bir kopyasını çıkartacak metin madenciliği çalışmalarımızı bu kopya ile yapacaktık.
Bu konuda yapılmış çalışmalar vardı (Tools for loading MEDLINE into a local relational database) ama biz bunun yerine MEDLINE formatında yıl yıl tüm veritabanını taramış ve tüm verileri .txt olarak indirmiştik.
Sonra uzun uğraşılar ile bunu bir oracle veritabanına dönüştürmüş ve SQL ile taranabilir hale getirmiştik. Bir de poster yapmıştık bu veri ile.
Sonra devam edemedik, verilerin olduğu bilgisayarda trajikomik bir şekilde sırra kadem bastı. Hayatımın en garip ve hayretamiz döneminde bu kaybolan veriyi tekrar bulmak için beklerken Edirect ile lokal PubMed verisi oluşturulabileceğini öğrendim.
Az önce yaklaşık 250 GB büyüklüğündeki lokal kopyayı oluşturmam bitti ve ilk taramalara başladım.
XML ile de öğreneceğim çok şey var daha.
Using EDirect to create a local copy of PubMed - The Insider's Guide to Accessing NLM Data - National Library of Medicine
Hiç yorum yok:
Yorum Gönder