GPTは「Chat」だけじゃない?意外と知られていない生成AI『BioGPT』とは
- AOAI
- Azure OpenAI Service
- ChatGPT
- OpenAI
- 医療・福祉業
生成AIとして最も有名なモデルは「ChatGPT」ですが、実はGPTはChatだけではありません。
そこで今回はあまり知られていない『BioGPT』というAIモデルについて紹介します。
(前の記事:Microsoft Build Japanを終えて 『AI旅行プラン組み立てアプリ』のブース出展)
BioGPTとは
OpenAI社のGPTモデルをベースにMicrosoft社が開発したバイオメディカルに特化した生成AIです。
BioGPTを利用することで、ChatGPTでは実現困難な医学・薬学関連の専門家に匹敵するレベルでの質問応答が可能となります。
2023年7月時点ではOpenAIのGPT-2モデルを採用しておりますが、今後GPT-3モデルへのアップデートが予定されています。
(参考:ChatGPTって何ができるの?3モデル?4モデル?何が違うの?(前編))
BioGPT誕生の背景
従来であれば医学・薬学関係の研究者の方々が特定情報を文献から検索していましたが、大量の情報から本当に必要な情報にたどり着くのに膨大な時間と労力を要しておりました。
これを解決すべきツールとして誕生したのが『BioGPT』です。
『BioGPT』が誕生したことにより医療専門家や研究者が医学的な情報を検索し、質問に回答する際に役立つ貴重な情報源となっています。
初期は言語モデル「BERT」というモデルを利用した「BioBERT」や「PubMedBERT」を開発しましたが、実用化に難があり最終的に「GPTモデル」を採用しました。
本モデルはMicrosoft社が「PubMed(※)」から2021年以前の論文データ(英語)を収集し、タイトルと抄録を含んだ1,500万件のコンテンツをデータセットとしてトレーニングしたモデルとされております。
※生命科学や生物医学に関する参考文献や要約を掲載するMEDLINEなどへの無料検索エンジンである。 アメリカ国立衛生研究所のアメリカ国立医学図書館(NLM)が情報検索Entrezシステムの一部としてデータベースを運用している
BioGPTのモデル
BioGPTには3つのモデルがあります。
BioGPT
いわゆる標準モデル。
BioGPT-Large
標準モデルよりも学習量が多く表現力も高い。文章を構造化することも可能。
BioGPT-2
性能はlargeとほぼ一緒だが薬(drug)関連に特化している。官能基の出力が可能。
それぞれのモデルの出力結果はこのようになります。
BioGPT
BioGPT-Large
同じ質問を投げても回答結果が大きく異なります。(青文字部分)
BioGPT-Largeの方がより詳細に説明されておりますので使い勝手が良さそうです。
BioGPT-2
BioGPT-2は先の2つとは異なり、薬(drug)を生成するのに特化したBioGPTの拡張バージョンです。
下記のように文章から官能基を出力します。
このように目的によってモデルを使い分けることが可能です。
ChatGPTとBioGPT-Largeの回答の違い
次はChatGPTとBioGPTの回答について比較してみました。
今回は「アスピリン」という解熱鎮痛剤について回答を求めました。
ChatGPT
回答内容の特徴としては「アスピリン」の定義や効果など、いわゆる一般的な情報が返ってきました。
次はBioGPT-Largeです。
BioGPT-Large
回答内容の特徴としては「アスピリン」の効果だけではなく、臨床実習の方法、その結果、そして結論まで、いわゆる研究者向けの情報が返ってきました。
同じGTPモデルでも学習データが異なるため、回答結果に大きな違いが出ることがわかりました。
BioGPTの使い方と料金体系
GitHub上にプログラムソースとインストール手順が公開されているので、GoogleColaboratoryやローカルに環境を構築して利用することができます。
(参考:GitHub/BioGPT)
特に必要な条件やライセンス契約はありません。
そのため誰でも無料で利用することができます。(2023年7月現在)
まとめ
今回ChatGPTの派生形である『BioGPT』について解説しました。
BioGPTを一般ユーザーが使う機会はそう多くはないと思いますが、医療従事者や研究者がより効率的に情報を収集することで医療技術の向上に貢献することが期待されています。
近い将来、画像認識技術と連携して患部をスマホでスキャンすると症状を特定して適切な治療方法を回答する・・・こんなサービスが誕生するかもしれません。
次回は生成AIの活用において注目を浴びている『Semantic Kernel』ついて紹介します。
(生成AI活用におけるMicrosoftの次世代OSS『Semantic Kernel』とは)
今回のコラムに関連のある資料
クラウドエキスパートサービス総合資料
クラウドエキスパートサービスの総合資料です。 船井総合研究所のクラウド開発の特徴やAIソリューション、そしてAzure OpenAI Serviceを用いた最新の開発事例をご確認いただけます。