技術書同人誌博覧会

新刊

同人誌・132ページ・4部頒布・紙・1,000円
チェックする

オープンソースOCRエンジンTesseractと全文検索ライブラリFlexSearch.jsを使って、CADと呼ばれるアッカド語辞書を電子辞書化してみました。

本書のトピックは以下のとおりです。

  • アッカド語と、CAD(シカゴ大学東洋学研究所アッシリア語辞典)の編纂の歴史
  • Tesseract5の画像とテキストの教師データによる追加学習
  • CNN/Kerasを使った画像認識による書体判別
  • FlexSearch.jsによる全文検索
  • オンライン辞書サービスの作成

開発記は読み物として読んでいただけるよう、ターミナルコマンドやプログラムソースを別の章に分けて掲載しています。

※なお、原辞書の知的所有権保護のため、開発したオンライン辞書は一般に公開していません。

ホーム
サークル
頒布物
マイページ