ソフトウェアエンジニアとして生成AI(LLM)に慣れるための試行錯誤の記録と、身近な情報検索サービスでの応用例の観察記録です。
新しい技術を使いこなすには手を動かして小さな学びを積み上げていくしかない。この一心で、昨年冬のChatGPTの登場から現在に至るまでの約一年の間、大規模言語モデル(Large Language Model)に慣れるために観察とAPI活用の実践を重ねてきました。
せっかくなのでこれらの取り組みを書き残しておこうというモチベーションで執筆が始まった一冊です。本書では、機械学習を専門としないソフトウェアエンジニアの立場として、先行サービスの観察による手掛かりの発見、未知の技術に対する勘を養うための実験、自身が開発するプロダクトへのLLMの効果的な適用方法、高度な技術のより良く見せるUIについて考えてきたことを共有するのを目指します。
初出イベント: 技書博9
知的生産を支援する検索システムを作っている話です。最近ブームな大規模言語モデルのAPIを活用した機能も解説します。マルチモーダルな画像検索とチャットの融合を考えます。
Phonno = Photos + Annotations は興味関心事を発見する画像検索システムです。ウェブアプリケーションとして開発・運用されています。現時点では筆者だけが使える完全プライベートなツールですが、一年以上のドッグフーディングを経てコンセプトも磨きがかかり、だいぶ仕上がってきました。一般公開の機運も高まってきているので、これに先駆けてこだわりの機能の紹介と設計を解説します。自分だけの検索エンジンを作ろうと考えている読者の皆さんの参考になることを願っています。
初出イベント: 技書博9
このツールの技術を解説しています。
https://pointillism.daiiz.dev (無料で試せます)
【概要】
写真を味わいのあるモノクロ点描画に変換するプログラムができました。
変換結果の例: https://twitter.com/daizplus/status/1329472947480788993
本書では、上記ツイートに載せた画像のような点描変換を実現するまでの考え方や製作過程をまとめました。
OpenCV を用いて画像処理を行う話がメインです。Colaboratory 上で軽く実験を行って必要な設計を洗い出し、Python 3 でコードを書いていきます。よく知られた画像処理手法を組み合わせて、手描き感を醸し出す点描画を生成するツールを作ります。
【見どころ】
初出イベント: 技書博7
SVG、PNG、ウェブサイトのスクリーンショット、XML、XSLT、Custom Elements
初出イベント: 技書博2
技書博に初参加してはじめて書いた本です。第10回を記念して再登場 🌸