ハンズオン: Transcribe入門¶
目的¶
Transcribeを利用して、音声データからテキストファイルを作成する。
前提¶
作業環境条件¶
本作業は、以下の作業環境で行います。
作業環境条件1: OSとバージョン
本手順は、Amazon Linux "Amazon Linux AMI release 2018.03"以降のOS環境での実施を前提としています。
コマンド:
cat /etc/issue | head -1
結果(例):
Amazon Linux AMI release 2018.03
作業環境条件2: シェルとバージョン
本手順は、bash "4.2.46(2)-release"以降のシェル環境での実施を前提としています。
コマンド:
bash --version -v | head -1
結果(例):
GNU bash, バージョン 4.2.46(2)-release (x86_64-redhat-linux-gnu)
作業環境条件3: AWS CLIのバージョン
本手順は、AWS CLIのバージョン"1.16.245"以降での実施を前提としています。
コマンド:
aws --version
結果(例):
aws-cli/1.16.245 Python/3.6.5 Linux/4.14.59-64.43.amzn1.x86_64 botocore/ 1.11.2
バージョンが古い場合は最新版に更新しましょう。
コマンド:
sudo -H pip install -U awscli
手順¶
ローカル環境での作業¶
今回は"${HOME}/tmp/parameter-handson-cli-transcribe"をパラメータファイル情報用ディレクトリとします。
ディレクトリが存在することを確認します。
コマンド:
ls -d ${HOME}/tmp/parameter-handson-cli-transcribe
結果(例:存在する場合):
${HOME}/tmp/parameter-handson-cli-transcribe
存在しない場合は作成します。
コマンド:
mkdir -p ${HOME}/tmp/parameter-handson-cli-transcribe
1. Transcribe用IAMポリシの作成¶
2. Transcribe用IAMユーザの作成¶
- 2.1. IAMグループの作成 (handson-cli-transcribe-transcribeMaint-group)
- 2.2. IAMグループのポリシー追加 (handson-cli-transcribe-transcribeMaint-group: handson-cli-transcribe-TranscribeWritePolicy)
- 2.3. IAMユーザの作成 (handson-cli-transcribe-transcribeMaint-user)
- 2.4. IAMユーザのIAMグループへの追加 (handson-cli-transcribe-transcribeMaint-user: handson-cli-transcribe-transcribeMaint-group)
- 2.5. APIアクセスキーの作成 (handson-cli-transcribe-transcribeMaint-user)
- 2.6. AWS認証ファイルの作成
3. 音声ファイル用S3バケットの作成¶
- 3.1. S3バケットの作成 (handson-cli-transcribe-source-XXXXXXXXXXXX)
- 3.2. IAMポリシドキュメントの作成 (handson-cli-transcribe-source-S3BucketWritePolicy)
- 3.3. IAMポリシの作成 (handson-cli-transcribe-source-S3BucketWritePolicy)
- 3.4. IAMグループのポリシー追加 (handson-cli-transcribe-transcribeMaint-group: handson-cli-transcribe-source-S3BucketWritePolicy)
4. 音声データの準備¶
5. 転写ファイルの作成 (サービスバケットの利用)¶
6. カスタマバケットの作成¶
- 6.1. S3バケットの作成 (handson-cli-transcribe-custom-XXXXXXXXXXXX)
- 6.2. IAMポリシドキュメントの作成 (handson-cli-transcribe-custom-S3BucketWritePolicy)
- 6.3. IAMポリシの作成 (handson-cli-transcribe-custom-S3BucketWritePolicy)
- 6.4. IAMグループのポリシー追加 (handson-cli-transcribe-transcribeMaint-group: handson-cli-transcribe-custom-S3BucketWritePolicy)
7. 転写ファイルの作成 (カスタマバケットの利用)¶
後始末1. カスタマバケットの破棄¶
後始末2. 音声ファイル用S3バケットの破棄¶
後始末3. Transcribe用IAMユーザの破棄¶
- 後始末3.1. APIアクセスキーの全削除 (handson-cli-transcribe-transcribeMaint-user)
- 後始末3.2. AWS認証ファイルの削除 (handson-cli-transcribe-transcribeMaint-user)
- 後始末3.3. IAMユーザのIAMグループからの削除 (handson-cli-transcribe-transcribeMaint-user: handson-cli-transcribe-transcribeMaint-group)
- 後始末3.4. IAMユーザの削除 (handson-cli-transcribe-transcribeMaint-user)
- 後始末3.5. IAMグループのポリシ削除 (handson-cli-transcribe-transcribeMaint-group: handson-cli-transcribe-TranscribeWritePolicy)
- 後始末3.6. IAMグループの削除 (handson-cli-transcribe-transcribeMaint-group)
後始末4. Transcribe用IAMポリシの破棄¶
後始末5. 一時ファイル用ディレクトリの破棄¶
一時ファイル用ディレクトリを削除します。
コマンド:
rm -Rf ${HOME}/environment/tmp-handson-cli-transcribe
後始末6. 設定ファイル用ディレクトリの破棄 (オプション)¶
(不要であれば)IAMポリシドキュメントファイル用ディレクトリを削除します。
コマンド:
rm -Rf ${HOME}/environment/conf-handson-cli-transcribe