😎

【インフラ_4日目】Azure1冊目

2024/07/22に公開

こんにちは投資ロウトです。

背景

AI案件に参画が決まり、Azureが使用されているとのことのため、用語を理解していくための必要性が出てきました。
※AWSは利用経験があるため、そちらと照らし合わせながら理解していきます。

学習アウトプット

Speech API

・音声テキスト変換・・・オーディオストリームから、リアルタイムで、音声の文字起こしを実施。
・音声合成・・・テキストを読み上げた音声を生成
・音声翻訳・・・日本語の音声から、翻訳をし、英語とフランス語に翻訳した出力ができる
・意図認識・・・家電の操作や予約などの意図を理解し、命令できる
・話者認識・・・音声から誰が話しているか認識する
・キーワード認識・・:・オーディオストリームから、特定のキーワードが存在することを認識する。

→キーワード認識はHey, siriやOK googleなどを識別する際に使われている技術なんだろうなと感じました。

Language API

・LUIS・・・会話型AIアプリケーションを構築するためのサービス
・QnA Maker・・・ナレッジベースを構築して、エンドユーザーからの質問を受け付け、それに対する回答を得られるサービス
・Text Analytics・・・自然言語のテキストに、感情分析、キーフレーズ抽出、言語検出などが行えるサービス
→AwsのAmazon Comprehendというサービスがこちらに該当しますが、AWS側なら使ったことがあるので、イメージが湧きました。

・Translator・・・テキストやドキュメントの機械翻訳を行うサービス
→こちらPDF、HTML、Excel、Wordなど構造とデータ形式を維持しながら90言語翻訳することができるのは、とてもいいなと感じました。やはりExcelやWordの産みの親であるMicrosoftが提供できるサービスは違いますね。

ボットサービス

ボットとは、エンドユーザーからの質問や指示に返答や対応できるコンピュータプログラムとのこと。ただしAIなどと違い、想定されたパターンしか応答できないとのこと。

Microsoft Bot Frameworkはbotを開発するためのフレームワークで、C#, Javascript, Python, Javaに対応しているとのことでした。

と短いですが、章が変わるので一旦以上で学習を区切りたいと思います。ご精読ありがとうございました。焦らずコツコツ頑張っていきたいと思います。

Discussion