Artwork

コンテンツは Manabu TERADA によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Manabu TERADA またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!

#71 hirokikyさんをゲストに 自然言語処理系AI Chat GPT / Whisperの話

1:36:59
 
シェア
 

Manage episode 358624886 series 2715344
コンテンツは Manabu TERADA によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Manabu TERADA またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

Guest:

ky(さん)と呼んでください!Python大好き、Webサービス大好き、自然言語処理も大好きなエンジニアです。ぜひTwitter(@hirokiky)でフォローしてください!株式会社ゼンプロダクツというスタートアップの代表取締役です。Shodoという、日本語をAIが校正してくれるWebサービスを開発・運営しています。オンライン上でMarkdownの執筆・レビューができるサービスですので、テックブログの運営にもおすすめです。DjangoCongress JPというカンファレンスも毎年主催しています。

Contents:

00:00:00 スタート

00:00:06 ゲスト hirokikyさんの紹介

00:01:29 2022年2月に自然言語やAIの話をしている振り返り。GPT-4の話もしていた

00:06:07 kyさんの自己紹介

00:08:24 terapyonの興味範囲。APIを使うより中身を勉強したい。

00:09:26 GPT-4はオープンソースでない寂しさがある

00:12:42 いまの自然言語系AI開発は飛行機ビジネスみたいにお金がかかるけど、ファインチューニングとかでオリジナルなものが作れる魅力はある

00:14:00 terapyonがOpen AIのWhisperで文字起こしをやっていてチューニングに挑戦中。モチベーションについて

00:18:18 AI系の技術スタックの理解が一つづつ難しい。huggingface, Datasets, DataLoader, transformers, PyTorch, PyTorch Lightning

00:27:51 pyhackなどのコミュニティや勉強会に助けられてきたので、MLの活用形のコミュニティはあるかな?

00:30:37 研究ではないMLエンジニアリングや運用といったことのノウハウ共有があると良い

00:36:31 Shodo.inkにChat-GPTの導入は面白いアイデアだと思った

00:41:51 AI生成やChat-GPT関連のライセンスや著作権問題は考えていきたいし、倫理的な問題になるかも

00:44:57 AIって最後は倫理問題かな

00:45:40 AIで鬱にならないで欲しい話、エンジニアリングとかまだまだ価値がある

00:49:45 詰め込み教育的な答えを出すのはChat-GPTのほうがすごいと思う

00:50:37 意外と自我っていうのは人間の物質的なものがあるかも話

00:52:36 Chat-GPTなのかWhisper触ってる場合じゃないのか?

00:54:15 1年前の時にスタジオを作って動画活用って言った振り返り

00:55:37 terapyonは本の紹介とかをプログラミング技術の動画講義を作りたい

00:59:39 一般社団法人PyCon JP Associationの理事にインタビューをリモートでやって動画にまとめた話 https://youtu.be/gr9t-P9CrsM

01:03:34 動画編集に文字起こしツールWhisperが大活躍した話

01:12:47 寺田が年齢関係なくガツガツやっているのを、他の人も真似しないかな?

01:21:58 Podcast収録したらまたやる気ができたのでもうちょっと勉強してみる

01:28:43 研究は面白いが、成果がでないこともあるので大変でもある。

01:29:27 AI系の学習タスクは、手元でやるか?クラウドでやるか? VRAM 8GB/12GB or クラウド

01:32:01 Whisperをインテル系CPUで動かすととてつもない時間がかかるが、Appleシリコンならそれなりに早い

01:35:31 WhisperをプロダクションでAWSで動かしたいときはkyさんが相談に乗ってくれる

--- Send in a voice message: https://podcasters.spotify.com/pod/show/terapyon/message
  continue reading

102 つのエピソード

Artwork
iconシェア
 
Manage episode 358624886 series 2715344
コンテンツは Manabu TERADA によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Manabu TERADA またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

Guest:

ky(さん)と呼んでください!Python大好き、Webサービス大好き、自然言語処理も大好きなエンジニアです。ぜひTwitter(@hirokiky)でフォローしてください!株式会社ゼンプロダクツというスタートアップの代表取締役です。Shodoという、日本語をAIが校正してくれるWebサービスを開発・運営しています。オンライン上でMarkdownの執筆・レビューができるサービスですので、テックブログの運営にもおすすめです。DjangoCongress JPというカンファレンスも毎年主催しています。

Contents:

00:00:00 スタート

00:00:06 ゲスト hirokikyさんの紹介

00:01:29 2022年2月に自然言語やAIの話をしている振り返り。GPT-4の話もしていた

00:06:07 kyさんの自己紹介

00:08:24 terapyonの興味範囲。APIを使うより中身を勉強したい。

00:09:26 GPT-4はオープンソースでない寂しさがある

00:12:42 いまの自然言語系AI開発は飛行機ビジネスみたいにお金がかかるけど、ファインチューニングとかでオリジナルなものが作れる魅力はある

00:14:00 terapyonがOpen AIのWhisperで文字起こしをやっていてチューニングに挑戦中。モチベーションについて

00:18:18 AI系の技術スタックの理解が一つづつ難しい。huggingface, Datasets, DataLoader, transformers, PyTorch, PyTorch Lightning

00:27:51 pyhackなどのコミュニティや勉強会に助けられてきたので、MLの活用形のコミュニティはあるかな?

00:30:37 研究ではないMLエンジニアリングや運用といったことのノウハウ共有があると良い

00:36:31 Shodo.inkにChat-GPTの導入は面白いアイデアだと思った

00:41:51 AI生成やChat-GPT関連のライセンスや著作権問題は考えていきたいし、倫理的な問題になるかも

00:44:57 AIって最後は倫理問題かな

00:45:40 AIで鬱にならないで欲しい話、エンジニアリングとかまだまだ価値がある

00:49:45 詰め込み教育的な答えを出すのはChat-GPTのほうがすごいと思う

00:50:37 意外と自我っていうのは人間の物質的なものがあるかも話

00:52:36 Chat-GPTなのかWhisper触ってる場合じゃないのか?

00:54:15 1年前の時にスタジオを作って動画活用って言った振り返り

00:55:37 terapyonは本の紹介とかをプログラミング技術の動画講義を作りたい

00:59:39 一般社団法人PyCon JP Associationの理事にインタビューをリモートでやって動画にまとめた話 https://youtu.be/gr9t-P9CrsM

01:03:34 動画編集に文字起こしツールWhisperが大活躍した話

01:12:47 寺田が年齢関係なくガツガツやっているのを、他の人も真似しないかな?

01:21:58 Podcast収録したらまたやる気ができたのでもうちょっと勉強してみる

01:28:43 研究は面白いが、成果がでないこともあるので大変でもある。

01:29:27 AI系の学習タスクは、手元でやるか?クラウドでやるか? VRAM 8GB/12GB or クラウド

01:32:01 Whisperをインテル系CPUで動かすととてつもない時間がかかるが、Appleシリコンならそれなりに早い

01:35:31 WhisperをプロダクションでAWSで動かしたいときはkyさんが相談に乗ってくれる

--- Send in a voice message: https://podcasters.spotify.com/pod/show/terapyon/message
  continue reading

102 つのエピソード

すべてのエピソード

×
 
Loading …

プレーヤーFMへようこそ!

Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。

 

クイックリファレンスガイド