いろいろ ChatGPT API アプローチ

alt text

ここでは https://platform.openai.com/docs/overview を見つつ、いろいろな API のアプローチをを紹介していきます。

画像認識 Vision

alt text

画像認識 Vision https://platform.openai.com/docs/guides/vision の紹介。

alt text

実際の事例です。

自然言語で返されると扱いづらいですが Function calling で JSON で受けられると一気に使い勝手が向上します。

画像生成 Image generation

alt text

音声生成 Audio generation

alt text

構造化テキスト Structured Outputs

alt text

より厳正な Function calling の指定ができるようになりました。

https://platform.openai.com/docs/guides/structured-outputs#supported-schemas

ここがわかりやすいです。

なんだかんだ Text generation のところの Quick Start が分かりやすい

alt text

https://platform.openai.com/docs/guides/text-generation

より深く知りたければ API Reference

alt text

https://platform.openai.com/docs/api-reference/introduction

より詳細に API の扱い方が分かります。

GPT-4o mini と GPT-4o の違いの話

OpenAIは、インテリジェンスを可能な限り広く利用できるようにすることを約束します。本日、当社で最も費用効率の高い小型モデルであるGPT-4o miniを発表します。GPT-4o miniによってインテリジェンスをより手頃な料金設定にすることで、AIで構築されるアプリケーションの範囲が大きく広がっていくものと期待しています。GPT-4o miniはMMLUで82%のスコアを記録し、現在LMSYSリーダーボード⁠(新しいウィンドウで開く)ではチャットの選好においてGPT-41を上回っています。料金は、100万入力トークンあたり15セント、100万出力トークンあたり60セントで、これまでのフロンティアモデルよりも桁違いに手頃であり、GPT-3.5 Turboよりも60%以上安価です。

まとめ

 GPT-4o miniの利用が適しているのは、回答の精度にこだわらず、出力スピードが速いとうれしい用途だ。一方で、多少の待ち時間は気にしないので、生成される内容の精度にこだわるという場合には、GPT-4oを選択しよう。また、例えば、有料プランユーザーであり、イラストを生成したり、ファイルをアップロードしてのデータ解析などを行いたかったりする場合にも、必然的にGPT-4oを選択することになるだろう。

results matching ""

    No results matching ""