Data Science LG: 学び合う統計とデータサイエンス
#36 企業におけるアノテーションの現実と課題:研究と実務のギャップ、そしてAI開発の未来 w/ ゆーごんさん
09 Aug 2025
【メッセージ募集】番組への質問やトークテーマのご提案、感想、ゲスト出演希望など、各種ご連絡は以下のフォームやX、Mailからお送り下さい。https://forms.gle/xmNbRKFQJQxZoRKJ6X:#DataScienceLGMail: [email protected]: https://discord.gg/8d6T5syBTZ番組HP: https://secret-mat-72c.notion.site/Podcast-Data-Science-LG-188a9bc7146f803dbc3ad1ea95ad49dc?pvs=149【今回の内容】このエピソードでは、企業研究者のゆーごんさんをゲストに迎え、企業でのアノテーションの実際とそれに伴う課題について深く掘り下げます。ゆーごんさんの経験を通して、アノテーション作業の複雑性を探ります。具体的な議論では、企業データが持つ「汚れ」理論上は簡単でも、実際には想像以上に時間と労力がかかること が強調されています。特に、動画データでは1秒あたり60枚の処理が必要な場合があること や、主観的な判断が必要な「ルール作り」の難しさ、アノテーションの質が学習精度に与える影響の把握不足 といった課題が挙げられました。また、アノテーションを外部企業に依頼する際にも、詳細な説明に膨大なコミュニケーションコストがかかること や、業界特有のニッチなデータの理解の難しさ が実務上の問題点として語られています。データ収集やAIモデル構築のプロジェクト全体の中で、アノテーションの「重さ」が軽視されがちであり、研究課題や解析の方向性そのものがアノテーションの負荷を高めてしまうケースがあることが指摘されました。アノテーションの重要性は、データ収集からAI学習、そして実務への応用全体に及ぶものであり、データサイエンス教育においても、アノテーションを含むプロジェクト全体の計画策定から評価までを実践的に学ぶことの必要性が提言されています。【note】https://secret-mat-72c.notion.site/note-24aa9bc7146f80fca807fc65e1976cc2?source=copy_link【出演者】◯酒井 彰筑波大学 博士課程Nospare Student Community 運営X: https://x.com/simplesho_clt?s=21LinkedIn: https://www.linkedin.com/in/ssakai0403/HP: https://shoshohh.github.io/ja/◯ゆーごん(中山 優吾)大学と企業の両方で研究に携わりながら、教育活動や地域創生プロジェクトにも積極的に参加しています。 知識と実践を結びつけ、社会に価値を提供することを目指しています。HP:https://yugo-nakayama.net/profile/LinkedIn:linkedin.com/in/yugo-nakayama-73216a1b3Researchmap:https://researchmap.jp/yougon研究分野:機械学習、高次元統計解析、多変量解析経歴:2023年4月 - 現在、企業研究員2020年4月 - 2023年3月、京都大学 大学院情報学研究科 助教Spotify:https://open.spotify.com/show/44vHXFAzqV292YyRvI9cZ9?si=15ddbbe5fc2645acApple Podcast:https://podcasts.apple.com/jp/podcast/data-science-lg-学び合う統計とデータサイエンス/id1784394537YouTube:https://www.youtube.com/playlist?list=PLw4Xosv9MWswLAe7xMYa3ut4UoP0e9_DeAmazon Music:https://music.amazon.co.jp/podcasts/93f29696-a96d-4c10-a37c-22d0c4e1153d/data-science-lg-学び合う統計とデータサイエンスNospare Student Community についてhttps://secret-mat-72c.notion.site/Nospare-Student-Community-Division-Activities-List-188a9bc7146f80f19daec821b55178ad?pvs=4Nospare Student Community 参加応募フォームhttps://t.co/nv3pZHXCiv#datascience#機械学習#統計学#podcast#データ分析
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
3ª PARTE | 17 DIC 2025 | EL PARTIDAZO DE COPE
01 Jan 1970
El Partidazo de COPE
13:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
12:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
10:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
13:00H | 20 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
12:00H | 20 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana