Aeneasが碑文解読を一変、歴史研究を加速
Aeneasはテキストと画像を同時に扱うマルチモーダルAIで、176,000件超の碑文データを活用し、確率的年代推定と研究者との協働で解読を高速化します。
古の文字が、AIで瞬時に語りかけてくる――そんな未来を感じさせるのがAeneasです。碑文の写真と本文を同時に読み取るマルチモーダルAIで、短い秒単位で複数の解釈候補を示し、研究者の作業を大きく速めます。公開デモはpredictingthepast.comで試せますし、コードやデータもオープン化が進められています。
マルチモーダルとは何か
マルチモーダルAIとは、文字情報と画像情報を同時に扱う仕組みです。Aeneasは碑文の写真から刻字の特徴を読み取り、本文テキストと合わせて解釈します。言わば、肉眼と辞書を同時に使って解読するようなイメージです。
巨大データと技術の中身
Aeneasの背後にはLatin Epigraphic Dataset(LED)という176,000件超のラテン碑文データがあります。モデルはトランスフォーマー型デコーダーを使ってテキストを処理し、画像情報は出土地や書体の手がかりとして使われます。碑文をベクトル化(埋め込み)して「歴史的指紋」として保存し、似た碑文を高速に検索できるのが強みです。
この組み合わせにより、従来のテキスト中心の手法では見落としがちな文脈や視覚的手がかりを捉えられます。たとえば同じ言い回しでも刻字の様子や碑の出所が異なれば、別の年代や用途を示唆する――そんな細かい違いを拾えます。
確率で示す新しい年代推定の考え方
Aeneasは「単一の正解」を提示しません。代わりに可能性を確率分布で示します。古典例のRes Gestae Divi Augustiでは、年代に二つの山(ピーク)が現れ、一つは紀元前10年〜紀元前1年、もう一つは紀元後10年〜20年に集中しました。語彙や称号、記念物の記載といった手がかりが、こうした分布を形作ります。
また、どの部分の情報が判断に効いたかはサリエンシーマップ(注目領域の可視化)で確認できます。これにより、判断の根拠が可視化され、研究者がAIの提案を吟味しやすくなります。
研究者との協働で生まれる現場の効果
23名の歴史家がAeneasを実際に使って評価を行いました。結果は期待以上です。AIの出す文脈情報と研究者の専門知識を組み合わせることで、新たな類例(パラレル)の発見や推定の確度向上、作業時間の短縮が確認されました。
Aeneasは既存ワークフローに組み込めるよう設計されており、Ithacaなど既存ツールとの統合も進められています。教育向けの教材作成や公開リソースの整備も進行中です。
利点と同時に意識すべきこと
この技術は教育や博物館、研究現場での実務を大きく変える可能性があります。しかし公開データの扱い方や透明性、説明責任といった倫理面の配慮は不可欠です。AIの提案を鵜呑みにせず、専門家の検証を組み合わせる運用が求められます。
これからの展望
今後はIthacaとのより深い統合で文脈化機能を強化し、未知長の復元や全体性能の向上を目指します。多言語・多媒体への拡張や教育現場向けのAIリテラシー教材も進められており、DigComp 2.2やUNESCO、OECDのAI能力フレームワークと連携した実装が想定されています。
古代の碑文というパズルを解く作業は、人間の経験と機械の速度が手を取り合う場になりつつあります。Aeneasはその先導役として、解読の速度と精度を同時に押し上げる力を持っていると言えるでしょう。ぜひデモを触って、あなた自身の目で確かめてみてください。