카이로 게니자 40만 문헌 디지털 전사 본격화

EU 1570억원 지원…이스라엘 국립도서관, 중세 유대 문헌 복원 착수rnAI 기반 전사 시스템 개발…1천만 이미지 추가 작업 예정

Share

▲ 카이로 게니자에서 발견된 11~12세기 속죄일 기도서 조각이 공개되고 있다. (이스라엘 국립도서관 소장)

이스라엘 국립도서관이 25일 카이로 게니자 문헌 약 40만 조각을 디지털 전사하는 국제 연구 프로젝트가 본격화됐다고 밝혔다. 이번 연구는 중세 유대 문헌 문화를 복원하기 위한 대규모 학술 사업이다.

 

프로젝트 이름은 ‘미드라시(MiDRASH)’로, 유럽연구위원회(ERC)가 2023년부터 6년간 1150만달러(1570억원)를 지원한다. 연구팀은 지금까지 촬영·디지털화만 이루어진 방대한 문헌을 체계적으로 전사해 학술 자료로 복원하는 작업을 진행 중이다.

 

프랑스 PSL 대학의 다니엘 스테클 벤 에즈라 교수는 프로젝트의 목표를 “중세 유대 문헌 문화를 재구성하는 것”이라고 설명했다. 그는 “카이로 게니자는 전 세계가 보유한 유대 중세 문헌의 핵심 자료”라며 “이번 전사 작업으로 새로운 연구 질문이 가능해진다”고 말했다.

 

카이로 게니자는 유대 전통상 하나님의 이름이 적힌 문서를 폐기하지 않는 관습 때문에 약 천 년 동안 카이로 벤 에즈라 회당에 보관된 문헌 모음이다. 건조한 기후 덕분에 보존됐고, 1896년 유럽 학자들에게 알려진 뒤 상당수가 영국으로 옮겨졌다. 그러나 전체 문헌 중 15%만 전사됐을 뿐, 상당수가 아직 읽히지 않은 상태로 남아 있다.

 

이스라엘 국립도서관의 차프라 시우 박사는 “1950년 벤구리온이 시작한 필사본 보존 사업 이후 가장 큰 기술적 진전”이라고 평가했다. 그는 “전사 자료는 온라인 플랫폼에 공개될 예정이며, 가능한 한 1년 안에 서비스할 계획”이라고 밝혔다.

 

연구팀은 오픈소스 플랫폼 ‘이스크립토리움’을 기반으로 히브리 문자 자동 전사 모델을 개발했다. 이 모델은 학자들이 수작업으로 만든 기존 전사본을 학습해 정확도를 높였다. 향후 추가로 약 1000만 이미지를 전사할 예정이다.

 

미드라시 프로젝트는 전사 이후 △문헌 인용 관계 △사상 전파 경로 △주석 전통 변화 등을 분석할 계획이다. 국립도서관은 전사 정확도 향상을 위해 11월 24~27일 ‘트랜스크라이브-어-톤’ 행사도 진행하고 있다.

 

연구팀은 전사 과정에서 오류가 발생할 가능성을 인정하면서도, “대량의 디지털 전사 자료는 중세 유대 문헌 연구의 지형을 바꿀 것”이라고 강조했다.

많이 본 뉴스

Local News