技術書同人誌博覧会

く-06

IT-コンピュータサイエンス-人工知能・AI

じゅ~しぃ~すくりぷと

AI機械学習、クラウドインフラ、北海道 https://shikoan.com/

チェックする
AI論文年鑑 2026

新刊

同人誌・237ページ・15部頒布・紙/電子・3,000円
チェックする

「使える技術」を探しやすく、「次に来る研究」も見つけやすく ── AI論文200本を厳選解説

おかげさまで 2025年版は
【第10回刺され!技術書アワード エポックメイキング部門 優秀賞 受賞】
しました!

本書について

NeurIPS、CVPR、ICLRをはじめとする20以上の著名な国際学会から、商用利用可能なコードが公開されているAI論文200本を厳選し、各論文の要約と重要図表を収録した年鑑形式のサーベイ本です。昨年刊行した初版に続く2冊目となる本書では、論文の選定方法・収録範囲・解説の両面で大幅な改良を施しました。

本書の最大の特徴は、LLMを中心とした自動化パイプラインによって論文を選定・解説している点です。初版では「被引用数×GitHubスター数」という人気度ベースのスコアリングでしたが、本書ではLLMによるOriginality(独創性)とElegance(洗練性)の評価を主軸に据えました。引用数やスター数では埋もれがちな「ダークホース」的論文を正当に評価し、選定に反映しています。

また、初版ではCV系がクラスタの大半を占めていましたが、本書ではCV・NLP・音声などの分野ごとにクラスタリングを行い、各分野に最低クラスタ数を保証。収集対象も20以上のカンファレンスに拡充し、ICASSP・Interspeech(音声)、KDD(データマイニング)、NAACL・EMNLP(自然言語処理)などを新たにカバーしています。

さらに、各章の冒頭にサーベイ記事を新設しました。クラスタに属する全論文をLLMに入力し、研究動向・主要アプローチ・今後の展望をまとめています。各論文を読む前に全体像をつかむことで、個別の論文の位置づけが理解しやすくなります。

各論文の掲載情報

各論文について、以下の情報を掲載しています。

・カンファレンス名・年度、論文タイトル、著者名、arXivリンク
・LLMによるジャンルタグ(5個)
・被引用数、GitHubスター数
・LLMによるOriginality(独創性)・Elegance(洗練性)スコア
・GitHubライセンス情報、GitHubリポジトリへのQRコード
・LLMによる要約(どんな論文か?/既存研究の課題/独自性や貢献/手法の詳細/結果)
・論文中の最重要画像

過去のバージョンの紙の本

季節モノのため、過去の紙の本は在庫切れです。Amazonでは受注販売していますのでこちらをご利用ください

・2025年版
https://www.amazon.co.jp/dp/B0F8VN3MBK

対象読者

・最新のAI研究動向を効率よくキャッチアップしたい研究者・エンジニア
・商用利用可能なオープンソースAI技術を探している実務家・プロダクト開発者
・限られた時間の中で「何を読むべきか」の指針が欲しい方
・CV、NLP、音声、ロボティクスなど幅広い分野に関心のある方

各章の紹介

本書は全10章構成で、各章がAI研究の主要トピックを網羅しています。

【第1章】DiTによる映像・3D生成の統合
Diffusion Transformer(DiT)の学習効率化、3D Gaussian Splattingのスケーリング、動画生成におけるモーション制御、そして理解と生成を統合するマルチモーダル基盤モデルの最前線を扱います。Depth Anything 3、REPA-E、Structured 3D Latents、VACEなど40本を収録。

【第2章】視覚基盤モデルの進化とロボット操作学習
視覚言語モデルの推論強化、ロボティクス・具象化AIへの応用、SAM 3やYOLOv12などの視覚基盤モデルの進化、そして生成AIのセキュリティまでを網羅。強化学習を推論プロセスやロボット制御に導入する最新アプローチを22本収録。

【第3章】人物画像生成・3Dシーン理解・動画行動理解
拡散モデルによる高精度な人物生成とアイデンティティ保持、単眼画像からの3D空間推定、動画行動理解、リモートセンシング基盤モデルまで、物理世界と視覚情報を紐づける多彩なアプローチを11本収録。

【第4章】LLMのアライメントとコード生成・自動開発
LLMの自己対局による推論強化、SWE-GymやKimi-Devなどの自律的ソフトウェア開発エージェント、テキスト向け拡散モデル、三値化LLMによるエッジ推論、視覚言語融合検索など多岐にわたるテーマを26本収録。

【第5章】報酬モデルの高度化と特化型AIエージェント
プロセス報酬モデル(PRM)のスケーリング、GUI操作・医療・Web探索などのドメイン特化エージェント、長文脈理解とRAGの高度化、SWE-benchシリーズの最新展開を18本収録。

【第6章】LLMアーキテクチャ革新と自然科学応用
TokenFormerやMulti-Token Predictionなどのアーキテクチャ革新、分子設計・タンパク質構造予測への生成モデルの応用、AI生成テキストの検出とセキュリティを16本収録。

【第7章】数理推論・定理証明と知識駆動エージェント
DeepSeek-Prover-V1.5やContinuous Thought Machinesなどの高度な推論手法、WebWeaverによる動的RAG、Agent-as-a-Judgeによるエージェント評価、科学的発見ベンチマークを18本収録。

【第8章】音声・音楽生成と大規模音響モデル
Stable Audio Open、JavisDiT++による音声・動画同時生成、低ビットレート音声コーデック、ゼロショット音声変換、音楽生成基盤モデルなど、音響AI分野の最前線を24本収録。

【第9章】生体信号AIと音声駆動アニメーション
脳波(EEG/MEG)と言語モデルを統合する生体基盤モデル、音声駆動の複数人対話動画生成、実環境音声処理、AIフェイク音声検知など新興分野の研究を6本収録。

【第10章】構造化基盤モデルとWebエージェント
時系列・表形式データの基盤モデル、Webブラウジングやコンピュータ操作を自動化するエージェント、気象予測やグラフ生成などの科学ドメイン向けモデルを19本収録。

目次
・はじめに
・第1章 DiTによる映像・3D生成の統合
 ・Depth Anything 3 / Wan-Move / REPA-E / Diffusion as Shader / Structured 3D Latents / VGGT / RF-DETR / Show-o2 / VACE ほか全40本
・第2章 視覚基盤モデルの進化とロボット操作学習
 ・SAM 3 / Absolute Zero / Cosmos Policy / DeepEyes / Data Scaling Laws in Imitation Learning / Flow-GRPO ほか全22本
・第3章 人物画像生成・3Dシーン理解・動画行動理解
 ・FaceXFormer / UniPortrait / SkySense V2 / AnyCam / EmbodiedSAM ほか全11本
・第4章 LLMのアライメントとコード生成・自動開発
 ・Large Language Diffusion Models / SWE-Gym / Kimi-Dev / Samba / Bitnet.cpp / Thinkless / YuE ほか全26本
・第5章 報酬モデルの高度化と特化型AIエージェント
 ・ReSearch / RM-R1 / ReTool / xLAM / SWE-bench Goes Live! / Scaling Agents ほか全18本
・第6章 LLMアーキテクチャ革新と自然科学応用
 ・TokenFormer / Multi-Token Prediction Needs Registers / Graph Diffusion Transformers / Concept Bottleneck Language Models ほか全16本
・第7章 数理推論・定理証明と知識駆動エージェント
 ・DeepSeek-Prover-V1.5 / Continuous Thought Machines / WebWeaver / Agent-as-a-Judge / SynLogic ほか全18本
・第8章 音声・音楽生成と大規模音響モデル
 ・DrVoice / Stable Audio Open / JavisDiT++ / FocalCodec / NotaGen / EMOVA ほか全24本
・第9章 生体信号AIと音声駆動アニメーション
 ・BrainOmni / NeuroLM / Let Them Talk / SONICS ほか全6本
・第10章 構造化基盤モデルとWebエージェント
 ・Moirai-MoE / WebThinker / ScaleCUA / TabDPT / OneForecast / DeFoG ほか全19本
・手法の紹介と、昨年からの改良
・限界と今後の展望

仕様

A5 / フルカラー / 237P

※2026年版

免責事項

本書のライセンス情報はLLMによる自動判定を含むため、誤りがある場合があります。最終的な確認はご自身の責任で行ってください。また、「手法の紹介と、昨年からの改良」「限界と今後の展望」以外のコンテンツは生成AI(LLM)により自動生成しています

立ち読み電子版を購入
チェックする

IaCは怖くない! Terraformを使って再利用可能なインフラストラクチャを学んでいこう

説明

本書はAWSの初心者~若干触ったことのある方向けの本です。Terraformとは、HashiCorp社により開発しているオープンソースのインフラ自動構成ツールです。AWSだけでなく、Google CloudやAzure、Discordなどのインフラを構築可能です。Terraformでは、インフラのデプロイ設定や手順をコードとして記載する「Infrastructure as Code(IaC)」の一種です。IaCを使うことで、デプロイの作業手順を再利用できるようになり、統一化や状態変更に対して頑強なシステムを作ることができます。

以前はTerraformといえば、「ブラウザから操作はできるけどIaCはちょっと…、せめてCDKにしてほしい」のように敷居が高いものでした。しかし、昨今の生成AIの進化(特にGPT-4oやo1シリーズ)により、コードの生成能力が急速に良くなりました。GPTはAWSのドキュメントはかなり多く学習しているため、Terraformのコード生成能力は非常に高いです。そのため、一気にハードルが低くなりました。著者も1年弱前ぐらいまでTerraform全然書けなかったのですが、GPTのおかげで書けるようになりました。本書はポスト生成AIのための、TerraformによるAWSの入門です。

私が認識している範囲だと、Terraformの本はEC2やVPCの作成から入っていることが多く、VPCの理解にかなりのハードルが高く最初の段階で挫折してしまいました。Lambdaのようなマネージドサービスから入ってほしくて、そこから次第にVPCのようなアンマネージドな世界に入っていく本がなかったので書きました。結局はページ数の関係で、1巻の段階ではVPCまでいかずにサーバーレスの世界で終わってしまうかもしれません。本当は、ECSあたりまで書きたかったのですが、続編にご期待ください。

「サーバーレスならSAMを使えばいいのではないか?」と思うかもしれませんが、SAMだとアカウントの運用ができずに、結局運用はTerraformで、アプリケーションはSAM(から生成されたCloudFormation)がちゃんぽんするという違法建築状態が出来上がります。この状態で開発やデプロイするのは結構大変で、最終的に全部Terraformに書き換える(ただ結構大変だった)という経験があったので、「サーバーレスだろうがなんだろうが全部Terraformで書く」前提で本を書いています。Terraformは少しコード長いですが、コードは生成AIに書かせればいいのです。

本書は各トピックごとにサービス別のサンプルケースで、50個程度のケースを用意するオムニバス形式です。ただ、だんだん扱える内容を増やしていくように段階的に説明するように心がけています。私が機械学習のバックグラウンドなので、想定例やコードが機械学習で、機械学習エンジニアがTerraformやインフラを学習するときの学習リソースを想定して書いています。

自分がそうであったように、Terraformの学習のお供に生成AIを使うのは全然ありだと思いますし、むしろ本書の演習問題に「ChatGPTを使って調べてください」のような問題も入れています。また「はじめに」の部分では、Terraformを作る上で便利な生成AIのモデル選択や、プロンプトエンジニアリングの話を書いています。

本書では、Terraformの書き方そのものだけではなく、「なぜこうするといいのか」というAWSの考え方や背景の部分も説明として取り入れています。特にシークレットの管理の話やところどころに入れているセキュリティの内容は、少し発展的ではあるのですが、大事なので入れました。本書が「AWSちょっとやってみようや」「Terraformとっつきにくいと思ってたんだけどやってみよう」と思ってる方の役に立つことを祈ります。

サンプルコード

本書のサンプルコードは以下のGitHubリポジトリにあり、サンプルコード自体はMITライセンスで利用できます。

https://github.com/koshian2/terraform-aws-book

お得情報

1・2巻のセット購入で500円OFF!

目次

・Terraformの基本構文
 ・tfenvによるTerraformのインストール
 ・バイナリでのTerraformのインストール
 ・Hello, Terraform
 ・ローカル変数(locals)
 ・入力変数(variable)
 ・terraform.tfvarsの活用
 ・コレクション(list)
 ・コレクション(Map)
 ・コレクション(Set)
 ・ファイル作成とプロバイダー
 ・for_eachメタ引数
 ・Zipファイルとdepends_on
 ・AWSアカウントと認証情報のセットアップ
 ・AWSのアカウントIDとリージョンの取得
 ・ステートファイルとローカルバックエンド
 ・リモートバックエンド(S3)
・AWS Lambda (1):基本編
 ・はじめてのAWS Lambda
 ・Lambdaの設定値変更(メモリ、タイムアウト)
 ・Lambdaの環境変数
 ・Lambdaのレイヤー
 ・複数のLambdaをデプロイ
 ・Lambdaの定期実行
・Amazon S3
 ・S3バケットの作成
 ・S3へのファイルアップロード
 ・S3のバージョニングの有効化
 ・S3のライフサイクルルール(1):バージョニングの管理
 ・S3のライフサイクルルール(2):ストレージクラスの移動
 ・S3のライフサイクルルール(3):オブジェクトの定期削除
 ・S3 Express One Zone
 ・S3でウェブサイトをホスト
・AWS IAM (1):ロール作成の基本
 ・IAMロールを作る
 ・IAMポリシーの作り方
 ・インラインポリシー
・AWS Lambda (2):サービス連携の応用
 ・LambdaとS3の連携
 ・LambdaとAmazon Translateの連携
 ・S3トリガーによるLambdaの実行
 ・S3トリガーによるTranslate
 ・Amazon SQS
 ・予約済み同時実行数
 ・LambdaとSQSの連携
 ・デッドレターキュー
 ・Amazon SNSを活用したメール通知
 ・Elastic Container Registry
 ・DockerベースのLambda
・シークレットの安全な管理
 ・シークレットの管理:SSM パラメーターストア
 ・シークレットの管理:Secrets Manager
・AWS App Runner
 ・App Runnerを活用した画像分類ブラウザアプリ
・AWS Step Functions
 ・テンプレート構文への代入(templatefile)
 ・Step Functions : 2つのLambdaをつなぐ
 ・Step Functions : 入出力の受け渡し
 ・Step Functions : 条件分岐
 ・Step Functions : リトライ
 ・Step Functions : 遅延処理
 ・Step Functions : 並列処理

Terraformで学ぶAWS(2):VPC編
同人誌・356ページ・15部頒布・紙/電子・2,500円
チェックする

AWSの王道中の王道、「VPC」環境をTerraformで構築! 仕組みを深く理解し、設計できるようになろう

本書について

本書は、AWSを利用する上で避けては通れない「王道」のサービスであるVPC、EC2、Application Load Balancer(ALB)などのコアなインフラ構築を、Terraformを通じて実践的に学ぶ解説書です。

AWSを学び始めた際、「サブネット」「ルートテーブル」「セキュリティグループ」といったVPC周りの複雑な概念や設定に直面し、挫折しかけた経験はないでしょうか。「ただEC2を起動したいだけなのに、なぜこれほどの手順が必要なのか」——本書は、そうした疑問や障壁を一つひとつ丁寧に解きほぐし、本質的な理解へと導きます。

本書のアプローチは、単にTerraformの文法を学ぶことではありません。コードを書くプロセスを通じて、「AWSのネットワークがどのように動いているのか」「なぜその構成がベストプラクティスなのか」というアーキテクチャの意図を深く理解することに主眼を置いています。
ネットワークの基礎設計から始まり、負荷分散、オートスケーリング、そしてCDNによる配信まで、段階的にシステムを育てていく構成をとっており、読み終える頃には「なんとなく動くインフラ」ではなく、「自信を持って設計・説明できるインフラ」を構築できるスキルが身につく一冊です。

本書の特徴と1巻との関係

前巻(Vol.1)では、初学者の認知負荷を下げるため、サーバー管理の不要な「マネージドサービス(Lambda等)」からスタートしました。
本書(Vol.2)では、いよいよAWSの根幹である「ユーザーが管理責任を持つネットワーク(VPC)」に正面から向き合います。コンテナやデータベース、AI活用など、将来どのような高度なサービスを使うにしても、この「足腰」となるVPCの知識は不可欠です。
なお、本書は独立した構成となっているため、1巻を読んでいない方でも問題なく学習を始めていただけます。

本書のマイルストーン

・セキュアな接続環境の構築:SSHポートを開放せず、Session Managerを用いて安全にEC2へ接続する環境を構築します。特に初心者が躓きやすい「CIDRの設計」から丁寧に解説します。
・Webアプリケーションの公開:ALB(ロードバランサー)とEC2を紐づけ、Webアプリを配信する基本構成を学びます。
・可用性とスケーラビリティの確保: Auto Scaling Groupを導入し、負荷に応じてサーバーが自動増減する仕組みを作ります。「Locust」を用いた負荷テストで実際の挙動も確認します。
・CDNによる高速配信: CloudFrontを前段に配置し、コンテンツ配信を高速化・セキュア化する構成まで仕上げます。

「なぜ」を説明できるエンジニアへ

生成AIやコーディングエージェントの普及により、インフラを動かすためのコードを書くハードルは劇的に下がりました。しかし、「なぜそのアーキテクチャを選んだのか」「なぜその設定が必要なのか」を説明し、最終的な構成に責任を持つのは、依然として人間の役割です。

そのため本書では、Terraformのコードだけでなく、「AWSのベストプラクティス」や「アーキテクチャの意図」についての解説に大きな比重を置いています。
本書の執筆にあたり、著者はAWS認定資格全12種(2025年時点)を取得し、さらにMCP、Claude Code、Gensparkといった最先端ツールを駆使してAWS公式ドキュメントに基づく厳密なファクトチェックを行っています。本文はGeminiを活用して執筆を行い、人間が書くよりも、高いクォリティの文章を生成することが可能になりました。精査された信頼性の高い知見に基づく「動くコード」と「深い解説」を通じて、自信を持ってインフラを設計・構築できるスキルを身につけてください。

紙の本について

・紙の本はA5で本文モノクロ・356Pです。

サンプルコード

本書のサンプルコードは以下のGitHubリポジトリにあり、サンプルコード自体はMITライセンスで利用できます。

https://github.com/koshian2/terraform-aws-book

お得情報

1・2巻のセット購入で500円OFF!

目次

・VPCとEC2:基本編
 ・VPC
 ・サブネット
 ・インターネットゲートウェイ
 ・ルートテーブル
 ・セキュリティグループ
 ・キーペア
 ・EC2への接続

・VPCとEC2:実践編
 ・インスタンスタイプ
 ・AMI
 ・EBS
 ・インスタンスプロファイル
 ・ユーザーデータ
 ・プライベートサブネット
 ・Elastic IP
 ・NATゲートウェイ
 ・Egress-Onlyインターネットゲートウェイ
 ・Systems Manager Session Manager
 ・NATインスタンス
 ・EFS
 ・ゲートウェイ型VPCエンドポイント
 ・インターフェイス型VPCエンドポイント
 ・EC2 Instance Connect
 ・スポットインスタンス
 ・Terraformモジュール(VPC)
 ・VPCピアリング
 ・VPC Reachability Analyzer
 ・VPCフローログ

・Elastic Load Balancing
 ・ALB
 ・ターゲットグループ
 ・リスナールールとパスパターン
 ・ヘルスチェック
 ・Route 53:ドメイン取得とホストゾーン
 ・Route 53のワイルドカードとALBのホストヘッダー
 ・ACMとSSL/TLS証明書
 ・内部ALB
 ・プライベートホストゾーン
 ・ALBアクセスログ
 ・NLB
 ・AWS PrivateLink
 ・VPC Lattice

・Auto Scaling Group
 ・EC2起動テンプレート
 ・Auto Scaling Group
 ・Auto Scaling GroupとALBの連携
 ・スケーリングポリシー:ターゲット追跡
 ・Locustによる負荷テスト
 ・カスタムメトリクスによるターゲット追跡
 ・ステップスケーリングとCloudWatch アラーム
 ・予測スケーリング

・Amazon CloudFront
 ・CloudFrontディストリビューション
 ・S3オリジン
 ・キャッシュポリシー
 ・オリジンリクエストポリシー
 ・カスタムオリジン:ALB
 ・CloudFrontと独自ドメインの連携
 ・CloudFrontとWAFの連携
 ・カスタムエラーレスポンス
 ・Lambda@Edge
 ・CloudFront Functions
 ・VPCオリジン

宗谷本線 車なし全駅巡り(車なし全駅巡りシリーズVol.2)
同人誌・136ページ・3部頒布・紙・1,500円
チェックする

北海道にある日本最北端の鉄道「宗谷本線」の、2020年に営業していた全53駅(2021年廃止12駅を含む)を、公共交通機関と徒歩のみで訪問せよ――。日高本線に続く、「車なし全駅巡り」シリーズの第2弾です。

本作では、秘境駅の宝庫として有名な「宗谷本線」の全区間全駅を訪問します。宗谷本線は2021年3月に12駅の大量廃止がありましたが、廃止駅のみならず全駅を訪問します。東六線、北剣淵、豊清水、糠南、雄信内、抜海といった秘境駅だけでなく、その駅の歴史、グルメなどを交えながらできる限り内容を詰め込みました。総制作6ヶ月にわたる膨大なボリュームで、この1冊で宗谷本線をきっと満喫できるでしょう。

本作は携帯しやすい「A5」サイズで、ガイドブック形式となっており、実際に宗谷本線の特急などに乗りながら読むと、より楽しめるのではないかと思います。

前作:「日高本線 車なし全駅巡り」
https://koshian2.booth.pm/items/2334590

通常版と完全版

この商品は「通常版」となります。通常版と完全版の違いは以下の通りです。サンプル画像の最後にもまとめてありますので、ご参照ください。

・通常版:A5 136P フルカラー オフセット印刷
・完全版:A4 456P フルカラー

通常版でも「完全版の電子版が付属します」。紙の本の完全版がどうしても欲しい方は、下記URLの「メロンオンデマンド(受注生産形式)」をご利用ください。完全版は高額なのでご注意ください。

https://www.melonbooks.co.jp/detail/detail.php?product_id=1004746

※電子版特典は紙の本に付属しています。「おまけファイル」による事前ダウンロードは今回ありません。

ガイドブック形式に

前作(日高)はA4に写真が4×2個の分割構成でしたが、今作(通常版)では見開き1ページで1つの駅を紹介する形を基本とします。一部の駅は見開き2ページの場所があります。宗谷本線のガイドブックとしてもおすすめです。

完全版は前作のフォーマットを踏襲しています。通常版はガイドブック形式、完全版は前作と同じとご認識ください。

歴史の要素を盛り込む

前作と異なった点として、今作は沿線の歴史や古地図の要素を入れました。今回登場するキャラクターはどちらも沿線の歴史に基づいたものです。特に完全版ですが、古地図や航空写真からの昔の姿の考察を随所に織り込みました。北大から開拓時代の写真を取り寄せ、本文中に掲載しています。

ホーム
サークル
頒布物
マイページ