Seminar for Graduation thesis

4年セミナー・4年プロジェクト

Notice for the remote access.

お知らせ

この授業の情報は、Web サイト ( http://ynitta.com/class/ ) と GoogleDrive に置きます。

GoogleDrive には @gm.tsuda.ac.jp のアカウントでアクセスして下さい。当初は@gm.tsuda.ac.jp全員がアクセス可能ですが、ある時点で履修登録者のみに制限します。

pdf形式の資料を配布する際は GoogleDrive 中の pdf/ フォルダに置きます。また、授業中に書き込みを行ったpdf形式のテキストなど、追加の資料は GoogleDrive のhandwritings/ フォルダに置くことがあります。

Web サイト http://ynitta.com/class/ 上の「課題提出Web」などの学内専用ページに学外からアクセスする場合は、 GoogleDrive の passwd.txt に記載されている [Web用] ユーザ名とパスワードを利用して下さい。

講義内容

前期は卒業研究のテーマに関する本を輪講します。発表担当は順番に割当てます。当番の学生が本の内容を説明し、他の学生がそれに質問する形で授業が進みますので、自分の担当箇所を必ず予習をしてきて下さい。

後期は、前期で学んだ知識を元に自分で考案したシステムを開発し、その成果を卒業論文にまとめます。

LLM (大規模言語モデル) とプロンプトエンジニアリング

LLM (Large Language Model, 大規模言語モデル)は、大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。パラメータ数とテキストデータの拡大により2020年以降性能が飛躍的に向上し、ChatGPT-3.5 (2022) の登場により注目を集めました。この背後にある技術が Transformers (2017) です。

従来、言語などの時系列データを扱うために、中間層に再帰構造を持つ深層学習モデル Recurrent Neural Network (RNN, 1986) が使われてきました。その後、「入力の情報を全て出力側に渡し重要度のスコア付けを学習する」ことで「系列データの特定の部分に注意を向けるように学習させる仕組み」であるAttention (2015)が導入されました。

Transformer (2017) は系列データから別の系列データに変換する深層学習モデルですが、RNNを使わずに Attention のみで構築することによりGPUを利用した学習の並列化が可能になり、大規模な自然言語処理モデルを学習できるようになりました。Google 翻訳や BERT (2018)/ GPT-2 (2019)/ GPT-3 (2020)/ GPT-3.5 (2022)/ GPT-4 (2023) などで使われています。

BERT (2018) は、Transformer ベースの encoder 部分のみを重ねた構造の深層学習モデルで、文章内のマスクした単語を予測することを得意とします。学習を「事前学習」と「ファインチューニング」の2段階に分けることにより、効率良い学習が可能です。

GPT-2 (2019) は Transformer の decode 部のみを重ねた構造のモデルで、任意の文章に続く次の単語を予測する処理を得意とします。「ファインチューニング」に加えて「Zero Shot (任意の文章に続く次の文章を予測する能力を使って、未学習のタスクの推論を行う)」手法を用いています。

GPT-3 (2020) では「ファインチューニング」に加えて「プロンプトプログラミング (自然言語でどのような知識をどのように使いたいかを例示する)」を用いて精度を向上させます。

GPT-3.5 (2022) では、人間のフィードバックによる強化学習を用いて、言語モデルと人間の指示の整合性を高めたモデルです。

GPT-4 (2023) は、テキストだけでなく画像も入力可能となりました。

Transformer は自然言語処理用に生まれた深層学習モデルですが、画像分類や画像生成に使われて目覚ましい成果を上げています。 Image GPT (2020) -> CLIP (2021) -> DALL-E (2021) -> Dall-E 2 (2022)

本ゼミでは、ChatGPT に至るまでの技術的な変遷を系統立てて理解し、自然言語処理の代表的なタスク(感情分析、自然言語推論、意味的類似度計算、多肢選択式質問応答など)についてtransformers を用いて実装する方法について学びます。

以下の情報は学内LANのみからアクセス可能です。学外からのアクセスはパスワードが必要です。

発表割り当て
速習: Matplotlib入門 by nitta@tsuda.ac.jp
~~TensorFlow2 TensorFlow & Keras 対応プログラミング実装ハンドブック~~ ← 今年度は使用しません。
Google Colab 用に書き直したGANはこちら。

授業日程および進捗状況

第1ターム (木曜2限)

教室: 対面授業@M202(実習室)

04.17(木) ... 授業内容説明。 jupyter notebookの使い方。 Google Colabの使い方(使い始める手順、使用例: FashionMNIST on Google Colab, 使い方のTips )
04.24(木) ... pythonの勉強: 「速習: Matplotlib入門 nitta@tsuda.ac.jp」
05.01(木) 2限 ... 「大規模言語モデル」1章, 2章
05.08(木) 2限 ... 「大規模言語モデル」3章, 4章
05.15(木) 2限 ... 「大規模言語モデル」~~5章 5-1, 5-2, 5-3~~ ← ipynb の実行でエラーが発生。対処は次回までに行う。
05.22(木) 2限 ... 「大規模言語モデル」~~5章 5-4-1, 5-4-2~~ 5章 5-1, 5-2, 5-3
05.29(木) 2限 ... 「大規模言語モデル」~~5章 5-4-3, 5-5~~ 5章 5-4-1, 5-4-2
06.05(木) 2限 ... 「大規模言語モデル」6章 5章 5-4-3, 5-5
06.12(木)(補講日) ... 授業無し
06.19(木) 2限 ... 「大規模言語モデル」7章 6章

第2ターム (木曜2限) (可能ならば第3タームの代替日とする)

06.26(木) 2限 ... 補講 09.11(木)1限の代講「大規模言語モデル」8章 8-3, 8-4
07.03(木) 2限 ... 補講 09.18(木)1限の代講「大規模言語モデル」9章 9-3
07.10(木) 2限 ... 補講 09.25(木)1限の代講「大規模言語モデル」9章 9-4-3, 9-4-4
07.17(木) 2限 ... 補講 10.02(木)1限の代講「大規模言語モデル」9章 9-5
07.24(木) 2限 ... 補講 10.09(木)1限の代講「OpenAI GPT-4V/ ChatGPT / GPTs 人工知能プログラミング実践入門」

第3ターム(木曜1, 2限)

09.11(木) 2限 ... LangChain, 各自の研究テーマについて相談 (1限は 06.26 へ)
09.18(木) 2限 ... Llama, 各自の卒論テーマにそって研究 (1限は 07.03へ)
09.25(木) 2限 ... 各自の卒論テーマにそって研究 (1限は 07.10へ)
10.02(木) 2限 ... dockerの説明 (1限は 07.17へ)
10.09(木) 2限 ... 各自の卒論テーマにそって研究, Llama を手元の mac (arm64) で動かす (1限は 07.24へ)
10.16(木)1, 2限 ... 各自の卒論テーマにそって研究
10.23(木) 1, 2限 ... 各自の卒論テーマにそって研究

2023年度卒論の競馬データの取得

10.30(木) 1, 2限 ... 各自の卒論テーマにそって研究

11.06(木) 1, 2限 ... 各自の卒論テーマにそって研究

第4ターム (木曜2, 3限)

11.20(木) 2, 3限 ... 各自の卒論テーマにそって研究

11.27(木) 2, 3限 ... 各自の卒論テーマにそって研究

12.04(木) 2, 3限 ... 各自の卒論テーマにそって研究

12.11(木) 2, 3限 ... 卒論執筆

12.18(木) 2, 3限 ... 卒論執筆

12.25(木) 2, 3限 (休業日) ... 授業なし
01.08(木) 2, 3限 ... 発表練習 (7分話す内容を pptx で作成してくること), 卒論直し

01.15(木) 2, 3限 ... 発表練習, 卒論直し

01.??(土) 15:00 卒論提出〆切
01.22(木) 2限+3限(12.26 の代講)(補講日) ... ~~授業なし~~ 発表練習、卒論概要直し

「卒論概要」のページ数は 2～4 ページとする。
本文は 1 段組もしくは 2 段組どちらでも可。フォントサイズは
タイトル：16 ポイント
氏名・ゼミ名：12 ポイント
本文：10.5 ポイント

01.??(土) 15:00 卒論概要提出〆切
01.30(木) 2, 3限+3限(01.28 の代講) ... 発表練習
01.31(土) ... 卒論発表会 08:40 集合@5101

link

x 人での発表時間は (2x+6) 分で、質疑応答1分含む．つまり
1名：7分発表
2名：9分発表
3名：11分発表
4名：13分発表

02.13(木) 15:00 卒論差し替え〆切 (差し替え提出用URLは02.01 に通知予定)

概要

出席状況

教科書

(注意)教科書は変更される場合があります。テキストを購入する前に担当教員に問い合わせてください。

大規模言語モデル入門
山田 育矢 (監修), 鈴木 正敏 (著), 山田 康輔 (著), 李凌寒 (著)
出版社 : 技術評論社 (2023/7/29)
ISBN-10 : 4297136333
ISBN-13 : 978-4297136338

本の情報: Amazon Japan (Amazonの説明より抜粋) 大規模言語モデルの理論と実装の両方を解説した入門書。大規模言語モデルの技術や自然言語処理の課題について理解し、実際の問題に対処できるようになることを目指す。
本の情報: 技術評論社
サポートページ(ソースコード、正誤表含む): github
個人メモ (nitta)

大規模言語モデル入門 II 〜生成型LLMの実装と評価〜
山田 育矢 (監修), 鈴木 正敏 (著), 西川壮介(著), 藤井一喜(著), 山田 康輔 (著), 李凌寒 (著)
出版社 : 技術評論社 (2024/9/4)
ISBN-10 : 4297143933
ISBN-13 : 978-4297143930

本の情報: Amazon Japan (Amazonの説明より抜粋) 「大規模言語モデル入門」の続編。本書では実装部分で扱い切れなかった話題を取り上げ、特に大規模言語モデルの評価と生成LLMに関連する解説を充実させる。「大規模言語モデル入門」の9章に続き、10章から始まる。
本の情報: 技術評論社
サポートページ(ソースコード、正誤表含む): github
個人メモ (nitta)

OpenAI GPT-4/ChatGPT/LangChain 人工知能プログラミング実践入門
布留川 英一 (著), 佐藤 英一 (編集)
出版社: ボーンデジタル (2024/2/22)
ISBN-10: 4862465943
ISBN-13: 978-4862465948

本の情報: Amazon Japan ボーン・デジタル
ソースコードのダウンロード: 公式のサポートサイト
個人メモ (nitta)

2024年1月に出版された本ですが、API 変更により2024年7月2日時点で6-3章(Assistant API の Retrieval)が動作しなくなっています。これに関しては、Retrieval の代替として Assistant APIに導入された file_serach を使って動作させる方法を説明します。

Vision Transformer 入門
監修: 片岡裕雄
著者: 山本晋太郎, 徳永 匡臣, 箕浦 大晃, QIU YUE, 品川政太郎
出版社 : 技術評論社 (2022/9/17)
ISBN-10: 4297130580
ISBN-13: 978-4297130589

Amazon Japan
技術評論社
サポートページ
ソースコード: github

個人的なメモ (nitta)

参考書

最短コースでわかる PyTorch &深層学習プログラミング
赤石雅典 (著)
出版社: 日経BP (2021/9/17)
ISBN-10: 4296110322
ISBN-13: 978-4296110322
本の情報: Amazon Japan
サポートサイト: github

個人メモ(nitta)

TensorFlow2 TensorFlow & Keras対応 プログラミング実装ハンドブック

出版社: 秀和システム (2020/10/28)
著者:チーム・カルポ
ISBN-10: 4798063002
ISBN-13: 978-4798063003

本の情報: Amazon
サポートサイト: 秀和システム
サンプルプログラム: ダウンロードサービス
個人的なメモ

Memo

https://www.tensorflow.org/lite/examplesTensorFlow Lite examples apps
DeepLearning 練習帳 [TensorFlow2 による実装]
Coursera: TensorFlow: Advanced Techniques Specialization
Image Segmentation についてわかりやすいプログラミング例 ... divam gupta's github [手元で試してみた] html
Image Segmentation 技術を使ったツール ... Machine Learning in a few clicks 自分のMLモデルを訓練できる無料ツール
情報科学科卒論(2020年度)

https://classroom.google.com/u/0/c/MjM5NTc0OTIyNjA1

情報科学科卒論(2020年度)の説明

https://classroom.google.com/c/MjM5NTc0OTIyNjA1/m/MjQ4ODQ4NzU3MzIy/details

卒論発表会プログラム (2021/01/30)
YouTube「はじめてのGoogle Classroom」

https://www.youtube.com/playlist?list=PLegIowl5n0_uNCWrZmwd-VxdijESa8i_H

YouTube「Gsuite使い方動画（先生向け）」

https://www.youtube.com/playlist?list=PL-AMTOjkSDF9_ZSzAnzXhUoUenjDyHUbG

Google Classroom ヘルプページ

https://support.google.com/edu/classroom/

Emacsのインストール方法