超効率化への挑戦: 大規模モデルの量子化のワークフローと研究状況 │ MMDS：数理・データ科学教育研究センター

超効率化への挑戦: 大規模モデルの量子化のワークフローと研究状況

市川佑馬氏（富士通株式会社人工知能研究所（主任研究員）、理研AIP（特任研究員））

AI・データ利活用研究会第104回

超効率化への挑戦: 大規模モデルの量子化のワークフローと研究状況

市川佑馬氏（富士通株式会社人工知能研究所（主任研究員）、理研AIP（特任研究員））

近年, LLM（Large Language Model）の大規模化に伴い, 推論速度の低下, メモリ使用量の増大, および電力コストの上昇といった課題が顕在化している. これらの課題に対処するため, 実数表現を離散化し計算効率を向上させる量子化技術が注目されている. しかし, LLMの量子化において, 極低ビット量子化の実現は困難であることが報告されている. 我々はこの課題に挑戦し, 1bitの極低ビット量子化であっても標準ベンチマーク上で平均90%の性能を維持することに成功した. 本講演では, この成果を実現するためのLLM量子化のワークフローおよび最新研究動向を体系的に概観する.

講師：	市川佑馬氏（富士通株式会社人工知能研究所（主任研究員）、理研AIP（特任研究員））
テーマ：	AI・データ利活用研究会第104回
日時：	2026年03月27日(金)　講演 18:00-19:00　質疑 19:00-20:00
場所：	オンライン開催
参加費：	無料
参加方法：	Zoomウェビナーを用いたオンラインでの開催となります。開催時刻：2026年3月27日 06:00 PM 大阪、札幌、東京トピック：AI・データ利活用研究会第104回このウェビナーに事前登録する： https://us02web.zoom.us/webinar/register/WN_334sHO34RACT9UVYW4xGlA ご登録後、ウェビナー参加に関する確認メールが届きます。
アクセス：	オンライン開催
お問い合せ：	本ウェブサイトの「お問い合せ」のページをご参照ください。