transformersのAutoModelで独自クラスを使う

2023-04-02 カテゴリー python, nlp, huggingface

本記事ではhuggingfaceのtransformersのAutoModelを使って独自クラスを利用する方法を紹介します。 transformersはAutoModelによって、事前学習済みモデルがどのモデルの実装なのかを意識せずに利用できます。たとえばモデルのアーキテクチャや事前学習済みのパラメータを変えて実験をするプログラムははモデル名をmodel_name_or_pathとした場合 model = AutoModel.from_pretrained(model_name_or_path) とだけ記述すれば事前学習済みパラメータで初期化されたモデルを読み込めます。このAutoModelで独自クラスを利用できればtransformersで実装されている他のモデルと同様に利用が容易になります。

【huggingface/datasets】複数のデータセットを組み合わせてサンプリングする

2023-01-30 カテゴリー python, nlp, huggingface

本記事はhuggingfaceのdatasetsを利用してサンプリングの割合を考慮しながら複数のデータセットを混ぜて扱う方法を紹介します。紹介する方法を知っておくと、例えば言語モデルの事前学習など、複数のテキストコーパスを組み合わせて利用する際に便利です。

【Python】pre-commitを使ってコミット前にプログラムを自動検査する

2023-01-28 カテゴリー python, git, pre-commit

本記事ではpre-commitを使ってコミット前にPythonプログラムを自動検査する方法を紹介します。モジュールのインポート順序や行あたりの文字数を始め、人が意識せずに標準化したいルールは多くあります。このようなルールをコミット前に自動で検査・修正することでより簡単にきれいなプログラム開発を進められます。

【自然言語処理】フリーで使える大規模な日本語テキストコーパス

2023-01-08 カテゴリー nlp

日本語を対象とした事前学習済みモデルの多くがこの記事で紹介するデータを利用して事前学習されています。この記事ではそれらのデータがどのように構築されたかをまとめます。

【Python】Poetryを使ったパッケージ管理

2022-12-31 カテゴリー python, poetry

以前setup.pyを使って自作パッケージをライブラリ化する記事を書きました。 setup.pyを代替するツールにPoetryというものがあります。 Poetryを使うことでパッケージが依存するライブラリの依存関係を自動で解消してくれます。本記事ではPoetryの基本的な利用方法についてまとめました。

【自然言語処理】A General Language Assistant as a Laboratory for Alignment【論文紹介】

2022-12-29 カテゴリー nlp, machine_learning

ChatGPTによる出力テキストが多くの人の期待を超え、驚愕しています。その背景には人の評価を模倣する報酬モデルを利用した強化学習の発展があります。この論文は人の好みに合うテキストを生成するための各種アプローチに対する評価を行なっており、なぜこのようなアプローチが取られているのか？という疑問の一つの答えになるのではないかと思います。

【書評】マッキンゼーが解き明かす生き残るためのDX

2021-10-15 カテゴリー book

本記事では【マッキンゼーが解き明かす生き残るためのDX】について書評します。ここ数年で話題となっているデジタル・トランスフォーメーション (DX) ですが、実際にどういう事を言うのか？言葉は広まっているけど実際にどういう実例があるのか？といった点に興味を持ったので本書を読みました。本書では様々な業種での実例を上げるとともに、DXをWhy、What、Howに分解して解説しています。本書を読むことでDXの概要を理解できます。

transformersのAutoModelで独自クラスを使う

【huggingface/datasets】複数のデータセットを組み合わせてサンプリングする

【Python】pre-commitを使ってコミット前にプログラムを自動検査する

【自然言語処理】フリーで使える大規模な日本語テキストコーパス

【Python】Poetryを使ったパッケージ管理

【自然言語処理】A General Language Assistant as a Laboratory for Alignment【論文紹介】

【書評】マッキンゼーが解き明かす 生き残るためのDX

Takuya Makino

【書評】マッキンゼーが解き明かす生き残るためのDX