TokyoTech-LLM

TokyoTech-LLM

東京工業大学情報理工学院の岡崎研究室と横田研究室で大規模言語モデルの研究・開発をしています。

View on HuggingFace
TokyoTech-LLM

Swallow

Llama 2の日本語能力を強化した大規模言語モデル (7B, 13B, 70B)

大規模言語モデルSwallowを公開

Llama 2に対する継続事前学習で日本語を強化した大規模言語モデルSwallowを公開しました。詳しくは、Swallowをご覧ください。

岡崎 直観

岡崎 直観

東京工業大学 教授

全体の統括、学習コーパス構築の統括および開発を担当

横田 理央

横田 理央

東京工業大学 教授

大規模言語モデル学習の統括を担当

藤井 一喜

藤井 一喜

東京工業大学 学部生

大規模言語モデル学習における開発、予備実験、本実験を担当

中村 泰士

中村 泰士

東京工業大学 学部生

大規模言語モデル学習における実験、評価実験を担当

服部 翔

服部 翔

東京工業大学 修士課程

学習コーパス構築の開発およびジョブ管理を担当

平井 翔太

平井 翔太

東京工業大学 修士課程

学習コーパス構築の開発およびジョブ管理を担当

Mengsay Loem

Mengsay Loem

東京工業大学 修士課程

大規模言語モデルの評価の計画および実験を担当

大井 聖也

大井 聖也

東京工業大学 学部生

学習コーパス構築の開発を担当

飯田 大貴

飯田 大貴

東京工業大学 博士課程

継続事前学習における語彙拡張の設計と開発を担当

水木 栄

水木 栄

東京工業大学 非常勤研究員

大規模言語モデルの実験の計画、評価の統括および分析を担当

Get in touch

Avenco comes with a built-in contact form.