科學(xué)家研究自動計算扁平化算法 可解讀復(fù)雜折疊信件文字

發(fā)布時間:2021-03-19 16:59:25  |  來源:雷鋒網(wǎng)  

史料,是歷史研究所需的重要材料,它幫助后人認(rèn)識、解釋、重構(gòu)了歷史過程的痕跡。在眾多史料中,書信是重要的一類。

在現(xiàn)代信封開始使用之前,人們習(xí)慣于用一種被稱為是 “鎖信”(letterlocking)的復(fù)雜方式對信紙進(jìn)行折疊,再用蠟密封,并安裝上防篡改裝置。

這種方式在當(dāng)時被視為是全球通信安全的基礎(chǔ)。MIT圖書館管理員 Jana Dambrogio 曾對這種方式進(jìn)行過介紹:

“鎖信”持續(xù)了幾個世紀(jì),不論是名人還是普通民眾都在使用。“鎖信”最早于一批梵蒂岡秘密檔案中發(fā)現(xiàn),其歷史可追溯至 1494 年。

Jana Dambrogio 與倫敦國王學(xué)院早期現(xiàn)代英國文學(xué)講師 Daniel Starza Smith 以及 “解鎖歷史”(Unlocking History)研究小組一起將 “鎖信”發(fā)展為一個研究領(lǐng)域。

一般情況下,對于 “鎖信”方式保存的信件,人們只有將其剪開才能讀到信件內(nèi)容——不過對于歷史學(xué)家來說,這樣簡單粗暴的方式無疑是對史料的一種破壞。

就在最近,一項技術(shù)幫助歷史學(xué)家們解決了這一難題——科學(xué)家們首次在不打開、不破壞信件的前提下 “閱讀”了封印的古老信件。

沒錯,科學(xué)家們擁有了透視功能!

“透視”書信首次實現(xiàn)

2021 年 3 月 2 日,相關(guān)研究成果發(fā)表于《自然》子刊《自然 • 通訊》(Nature Communications),題為 Unlocking history through automated virtual unfolding of sealed documents imaged by X-ray microtomography(解鎖歷史:基于X 射線微斷層掃描成像的密封文檔自動虛擬展開)。

論文作者來自 MIT(圖書館、計算機(jī)科學(xué)和人工智能實驗室)、Adobe 研發(fā)中心、英國倫敦國王學(xué)院、倫敦瑪麗女王大學(xué)、荷蘭烏得勒支大學(xué)、萊頓大學(xué)、內(nèi)梅亨大學(xué)。

據(jù) MIT官網(wǎng)介紹,這項突破性的研究是史料保護(hù)者、歷史學(xué)家、工程師、成像專家和其他學(xué)者跨國界、跨學(xué)科合作的結(jié)果。

研究團(tuán)隊通過在文藝復(fù)興時期的歐洲信件上進(jìn)行演示,終于實現(xiàn)在不打開、不破壞的前提下 “閱讀”了封印的信件。

研究人員對一封標(biāo)號為 DB-1627 的信件進(jìn)行了還原:這封信寫于 1697 年 7 月 31 日,出自一位法國商人 Jacques Sennacques 之手。在信中,他向堂兄 Pierre Le Pers 請求提供一份 Daniel Le Pers 的死亡通知副本。

值得一提的是,在進(jìn)行計算分析之前,研究人員只知道寫在郵包表面的收件人姓名。

“虛擬展開”算法已開源

研究團(tuán)隊所運用到的是一種自動計算扁平化算法。

論文介紹,計算扁平化算法目前已成功地應(yīng)用于對損壞的歷史文獻(xiàn)進(jìn)行 X 射線微斷層掃描,但還僅限于卷軸、書籍、僅僅被折疊過一兩次的文檔。

相比于上述情況,研究團(tuán)隊要解決的難題是:對通過 “鎖信”方式保存的信件錯綜復(fù)雜的褶皺和縫隙進(jìn)行重建。

研究團(tuán)隊的思路是對信件進(jìn)行逆向工程,也就是說,信件本身就是研究歷史通信安全方法的關(guān)鍵數(shù)據(jù)集。

他們觀察到了信件內(nèi)置的防篡改鎖定機(jī)制,這種機(jī)制主要是通過不可逆的破壞來阻止?jié)撛跀r截者,接收者能夠借助這種機(jī)制檢測到所謂的 “中間人”攻擊——正是借助這一機(jī)制,研究人員可以給信件分配一個安全分?jǐn)?shù)。

不過基于一種特殊的設(shè)計,信件只有在預(yù)定目的地才能打開。因此研究人員要設(shè)計系統(tǒng),還得通過已打開的信件進(jìn)行推斷。

具體來講,團(tuán)隊的研究對象是 “布里耶納收藏”(Brienne Collection),這是一個歐洲郵政局長的箱子,里面裝有 1680-1706 年未遞送的信件。箱子里有 3148 件已編目的物品,包括 2571 封已打開的信件、碎片和其他文件,以及 577 個未打開過的郵包。

下圖展示的是團(tuán)隊主要研究的 4 個郵包。

他們利用高對比度延時積分 X 射線微斷層掃描(X-ray microtomography,XMT)產(chǎn)生的高分辨率體積掃描,開發(fā)了一種 “虛擬展開”(virtual unfolding)方法,即一種完全自動的、重建和虛擬展開信件成像的體積掃描方法。

再用算法識別、區(qū)分信件的每一層:這一步的原理是墨水和信紙會形成不同反差,信里的內(nèi)容會得到展現(xiàn)。

對于歷史學(xué)家和文物保護(hù)人員來說,即便是信件的折痕和縫隙,都是很有價值的證據(jù)。因此,能夠在無損的情況下獲取信件內(nèi)容,是歷史文獻(xiàn)研究的一大進(jìn)步。

將算法與其他學(xué)科相融合,促進(jìn)其他領(lǐng)域研究發(fā)展,也許是這項研究最大的意義所在。

正如論文合著者之一、來自萊頓大學(xué)的 Nadine Akkerman 所言:

我們所取得的成就不僅僅是打開無法打開的信件,閱讀難以閱讀的內(nèi)容。我們展示了真正的跨學(xué)科工作如何打破界限,調(diào)查人文學(xué)科無法獨立解決的內(nèi)容。

關(guān)鍵詞: 科學(xué)家 扁平化 文字

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com