Artwork

コンテンツは Slator によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Slator またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!

#218 How Large Language Models Replace Neural Machine Translation with Unbabel’s João Graca

44:59
 
シェア
 

Manage episode 428499235 series 2975363
コンテンツは Slator によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Slator またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

João Graça, Co-founder and CTO of language operations platform Unbabel, joins SlatorPod to talk about the present and future of large language models (LLMs) and their broad impact across all things translation and localization.

First, the CTO explains how Unbabel was founded to address language barriers for people using services like Airbnb, combining MT with human validation to improve translation quality.

João believes that LLMs are quickly replacing neural MT models as much more R&D is going into LLMs vs NMT. He highlights that LLMs can handle more complex tasks like automatic post-editing, source correction, and cultural adaptation, which were previously difficult to achieve with traditional models.

He also tells the backstory of the company's decision to develop TowerLLM. João shares how Unbabel's approach involves using open-source LLMs, fine-tuning them with multilingual data, and applying techniques like retrieval-augmented generation to improve translation quality in production settings.

Despite the advancements, João acknowledges that human intervention is still necessary for high-stakes translation tasks.

The podcast concludes with the hiring environment for AI talent and the future directions for LLM development, with João expressing optimism about the continued progress and potential of these models.

  continue reading

1. Intro (00:00:00)

2. Background and Motivation Behind Unbabel (00:00:34)

3. Research Contributions (00:04:13)

4. NLP and LLM Impact (00:07:10)

5. RAG Approach (00:09:12)

6. Adapting Production Processes (00:11:04)

7. Evaluating Model Usage (00:12:42)

8. Evolution from Neural MT to LLMs (00:13:56)

9. Comparing Price (00:15:44)

10. Why Unbabel Decided to Build TowerLLM (00:16:43)

11. TowerLLM Development Process (00:18:49)

12. Multilingual Model Performance (00:23:07)

13. Model Usage and Commercial Restrictions (00:25:25)

14. Quality Testing Process (00:26:24)

15. TowerLLM Challenges (00:29:20)

16. Future of Translation Technology (00:30:19)

17. Areas of Application for LLMs (00:32:09)

18. Understanding xTOWER (00:34:49)

19. AI Pipelines (00:37:23)

20. Language Coverage (00:38:59)

21. Hiring Environment (00:40:43)

22. Acceleration of LLMs and AI Progress (00:41:51)

227 つのエピソード

Artwork
iconシェア
 
Manage episode 428499235 series 2975363
コンテンツは Slator によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Slator またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

João Graça, Co-founder and CTO of language operations platform Unbabel, joins SlatorPod to talk about the present and future of large language models (LLMs) and their broad impact across all things translation and localization.

First, the CTO explains how Unbabel was founded to address language barriers for people using services like Airbnb, combining MT with human validation to improve translation quality.

João believes that LLMs are quickly replacing neural MT models as much more R&D is going into LLMs vs NMT. He highlights that LLMs can handle more complex tasks like automatic post-editing, source correction, and cultural adaptation, which were previously difficult to achieve with traditional models.

He also tells the backstory of the company's decision to develop TowerLLM. João shares how Unbabel's approach involves using open-source LLMs, fine-tuning them with multilingual data, and applying techniques like retrieval-augmented generation to improve translation quality in production settings.

Despite the advancements, João acknowledges that human intervention is still necessary for high-stakes translation tasks.

The podcast concludes with the hiring environment for AI talent and the future directions for LLM development, with João expressing optimism about the continued progress and potential of these models.

  continue reading

1. Intro (00:00:00)

2. Background and Motivation Behind Unbabel (00:00:34)

3. Research Contributions (00:04:13)

4. NLP and LLM Impact (00:07:10)

5. RAG Approach (00:09:12)

6. Adapting Production Processes (00:11:04)

7. Evaluating Model Usage (00:12:42)

8. Evolution from Neural MT to LLMs (00:13:56)

9. Comparing Price (00:15:44)

10. Why Unbabel Decided to Build TowerLLM (00:16:43)

11. TowerLLM Development Process (00:18:49)

12. Multilingual Model Performance (00:23:07)

13. Model Usage and Commercial Restrictions (00:25:25)

14. Quality Testing Process (00:26:24)

15. TowerLLM Challenges (00:29:20)

16. Future of Translation Technology (00:30:19)

17. Areas of Application for LLMs (00:32:09)

18. Understanding xTOWER (00:34:49)

19. AI Pipelines (00:37:23)

20. Language Coverage (00:38:59)

21. Hiring Environment (00:40:43)

22. Acceleration of LLMs and AI Progress (00:41:51)

227 つのエピソード

すべてのエピソード

×
 
Loading …

プレーヤーFMへようこそ!

Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。

 

クイックリファレンスガイド