中国专业当代艺术资讯平台
搜索

人工智能与志愿者协同发力:普兰丹-莫雷图斯博物馆为档案注入新生命

来源:湖南省博物馆/编译 作者:刘卓凡 2026-01-13

走进比利时安特卫普的普兰丹-莫雷图斯博物馆(Plantin-Moretus Museum),仿佛步入了那段历史。这里曾是克里斯托夫·普兰丹(Christophe Plantin)于1555年创立的工坊,一片繁忙景象,后来成为其后裔莫雷图斯(Moretus)家族的居所。这些建筑不仅弥漫着油墨与纸张的气息,还保留了三百年的生活痕迹——日记、账本、信件、随手记,都被精心存放在创作之处。

馆藏档案研究员克里斯托夫·塞勒斯拉赫(Kristof Selleslach)表示:“这些档案对于研究16、17世纪荷兰的书籍制作和文化生活极具价值。正因如此,普兰丹-莫雷图斯博物馆致力于将这些档案数字化,让更多观众与全世界研究者都能接触这些内容。”

难题出在哪里?成千上万页手写文稿,不仅语言多样,其书写还采用了让人难以辨认的现代早期潦草笔迹。

从纸质记忆到数字声音

普兰丹-莫雷图斯博物馆面临的挑战十分明确:解锁大多数人难以辨认的手写文字背后的故事。

项目工作人员汤姆·埃尔肯斯(Tom Eerkens)称:“用传统方式转录需要耗费无数工时,但人工智能加上志愿者的协作,让我们得以高效推进这项工作。”

项目团队选择了Transkribus,这是由因斯布鲁克大学(University of Innsbruck)开发的手写文本识别平台。其算法可以生成初步转录结果——虽不完美,但足以作为志愿者工作的起点。正如埃尔肯斯所说:“这些自动转录结果还有少许误差,仍然需要人工校对修正,这也是公众科学(citizen science,译者注:公众与职业科学家合作开展科学研究的创新形式,强调双向参与和价值共创)项目发挥作用的地方。”

建立线上公众学者社区

这个项目才上线一年,志愿者们响应迅速。志愿者安妮克·范德福德(Anneke Van de Voorde)回忆道:“我在网上看到你们博物馆招志愿者做转录,我发了封邮件后很快收到回复,事情就这么定了下来。那是今年3月份的事了。”

对波勒·霍弗(Paule Hofer)这样的参与者来说,初期过程颇具挑战。她说:“刚开始,当然得摸索它是如何运作的。一旦熟练了,也没那么难。”她还提到关键在于语境,“有上下文时,通常好理解。但若脱离语境,单个词汇有时就难懂了。”

为了支持不断扩大的志愿者群体,普兰丹-莫雷图斯博物馆建立了一个名为Slack的工作区,志愿者们可以在那里提问、分享难辨认单词的截图,或简单交流心得。埃尔肯斯说:“转录实际上成了一项集体劳动,而不仅仅是个人任务。参与者随时随地自发帮助普兰丹-莫雷图斯博物馆推进这项工作。”

对安妮克来说,这种同志情谊是参与其中的一大乐趣,“我可以在Slack上请教我的志愿者同伴。我把问题发在主题帖里,大家通常都会及时回应。”

人工智能与人类智能并肩作战

像安妮·莉丝·多门(Anne-Lise Domen)这样的志愿者认为人工智能不是对手,而是伙伴。她说:“有时看到一些字迹,会想,天哪,这根本无从下手。人工智能虽然也不能百分百准确识别,但至少提供了一个切入点。显然,我们不能把AI识别的结果照搬进线上目录,但它提供了一个好的起步。”

她的热情显而易见:“我完全认同这个理念——让珍贵档案面向公众,面向网络,不仅博物馆现场的观众可以看到,全世界的人都可以通过网络领略其中蕴含的丰富信息。”

档案中的发现

这些档案宛如一扇透视日常生活的窗口。志愿者常常沉浸在细节之中。安妮克说:“我喜欢这些与17世纪安特卫普相关的内容——他们订购大量黄油,饮品只有烈酒、啤酒和葡萄酒,去乡下还得有通行证。还有马车夫娶女仆的完整长篇故事。简直能拍成一部类似《权力的游戏》的电视剧。”

普兰丹-莫雷图斯博物馆已着手将这些发现融入展览。塞勒斯拉赫说:“我们大约有40位线上志愿者,他们已经转录了几份与印刷工坊和家族产业有关的档案。我们会把这批转录内容用于即将推出的展览,展览聚焦那些在这个“黄金圆规”(Golden Compasses,译者注:普兰丹家族及其企业的徽记主体为一个圆规,后常用于指代该家族)家族工作生活过的女性。”

长期愿景

这个项目远未结束。埃尔肯斯说:“我们的目标是对尽可能多的档案完成转录,但这并不意味着我们没有阶段性成果。这些转录成果帮助我们更新现有的档案目录,实现档案的条目级检索利用。最重要的是,这个项目让沉睡于历史中的声音重获新生。”

档案记录下了这样一句动人的话语:“亲爱的父亲与母亲,我将永远是你们谦逊的儿子,克里斯托弗·玛丽亚·莫雷图斯。”

这提醒我们,在数百年历史的油墨与纸张背后,是一个个真实的人,既有家人、工人,也有商人。得益于人工智能、志愿者与守护这些记忆的博物馆之间的协作,他们的生活再次被后人听见。

 

本文来源:

克里斯托夫·塞勒斯拉赫和汤姆·埃尔肯斯在2025年数字藏品峰会(Digital Collections Summit 2025)上的分享。

(刘卓凡 译自MuseumNext网站)

相关新闻