メインコンテンツへスキップ

はじめに

Microsoft Azure で GPT-3.5 または GPT-4 モデルを W&B でファインチューニングすると、メトリクスが自動的に取得され、W&B の実験管理ツールと評価ツールによって体系的な評価が可能になるため、モデル性能をトラッキング、分析、改善できます。
Azure OpenAI のファインチューニング メトリクス

前提条件

ワークフローの概要

1. ファインチューニングのセットアップ

  • Azure OpenAI の要件に従って、トレーニングデータを準備します。
  • Azure OpenAI でファインチューニング ジョブを設定します。
  • W&B はファインチューニングのプロセスを自動的にトラッキングし、メトリクスとハイパーパラメーターをログします。

2. 実験管理

ファインチューニング中、W&B では次を記録します:
  • トレーニングおよび検証のメトリクス
  • モデルのハイパーパラメーター
  • リソース使用状況
  • トレーニング成果物

3. モデル評価

ファインチューニング後、W&B Weaveを使用して、次のことを行います。
  • モデルの出力を参照用データセットに対して評価する
  • 複数のファインチューニング run 間でパフォーマンスを比較する
  • 特定のテストケースにおけるモデルの挙動を分析する
  • モデル選択のために、データに基づいて意思決定する

実際の使用例

追加リソース