GPT-4 API活用英語学習支援ツール

GPT-4 APIを活用した英語学習支援ツール

最新AIとWeb自動化技術を連携させ、オンライン英語課題の解答ヒント生成を実現する学習効率化ツール。

                    TECHNICAL STACK
                    言語: Python
AI: OpenAI API (GPT-4 / GPT-3.5-turbo)
ブラウザ自動化: Selenium
音声処理: SpeechRecognition, Pydub
その他ライブラリ: Requests

                

1. 課題と開発コンセプト

大学の英語学習プラットフォームは、反復的なクリック操作が多く、解答に詰まった際のサポート機能も限定的でした。

この課題に対し、SeleniumによるWeb操作の自動化と、GPT-4 APIの高度な自然言語処理能力を統合。「課題ページへの自動遷移」と「文脈に応じた解答ヒントの生成」を両立するツールを開発しました。目的は、学習の障壁となる煩雑な操作を削減し、AIによるヒントを元にユーザー自身の思考を促すことで、学習効率を最大化することです。

2. システム構成と処理フロー

① Seleniumによる学習フローの自動化

自動ナビゲーション: ログイン後、目的の課題（Reading/Listening）ページまで、一連の画面遷移を自動で実行します。
問題情報の自動集約: 表示されている問題文、選択肢、音声データなどの情報を自動で抽出し、AI処理のためにバックエンドへ送信します。

② OpenAI API連携による解答ヒント生成ロジック

Reading問題のヒント生成: 抽出した問題文と選択肢からプロンプトを生成。「なぜその答えになるのか」の根拠や文法的な解説など、思考を助けるヒントをGPT-4に生成させます。
Listening問題のヒント生成: 音声ファイルを自動で文字起こしし、その内容と問題文を基に、解答の手がかりとなるポイントをGPT-4が解説します。

3. 主な機能と実装詳細

Reading問題ヒント生成機能

英文の空所補充問題に対し、文脈や文法構造をGPTが分析。正解の選択肢を示唆する解説や、関連する重要単語のリストを提示し、自力での解答をサポートします。

Listening問題ヒント生成機能

音声の主要な会話の流れやキーワードを文字起こしデータから要約。設問の意図と照らし合わせ、どの部分に注目して聞くべきかのヒントを提供します。

動的な情報取得と連携

JavaScriptによって動的に読み込まれる問題にも対応。Seleniumの待機機能を駆使して問題情報を確実に取得し、AIへの連携を安定的に実現しています。

音声データの自動処理

ページ上のMP3ファイルを直接ダウンロード・変換し、SpeechRecognitionライブラリを用いて高精度な文字起こしを自動で行う処理パイプラインを構築しました。

4. 成果と今後の展望

このプロジェクトを通じ、Web自動化技術と外部の高度なAI APIを連携させる一連のプロセスを実践的に習得しました。単に情報を取得するだけでなく、音声のようなマルチメディアデータを処理し、それを基に付加価値（ヒント）を生成するシステムを構築できたことは、大きな自信となりました。今後は、この技術を応用し、より多様な学習プラットフォームに対応できる汎用的な支援ツールの開発を目指しています。