くりらじ静岡局から、技術屋目線で技術情報を追いかける番組をお届けします。
…
continue reading
コンテンツは regonn&curry によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、regonn&curry またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!
Player FMアプリでオフラインにしPlayer FMう!
22. Pythonライブラリを作ってみる
Manage episode 227541589 series 2436384
コンテンツは regonn&curry によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、regonn&curry またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
Scrapbox
お題
fastai/fastprogress
- fastaiのプログレスバー
特徴量エンジニアリングの書籍がでるっぽい
uber/ludwig
- 米Uber、コードを書かずに深層学習モデルのトレーニングができるツール「Ludwig」を発表 | OSDN Magazine
- uberが出してきた、コードを書かずに機械学習ができるツール
- まだ、あまり情報や記事は出てきてない
- 今後こういうのが増えてきたら、Kaggleのスコアがベースアップしてきて、より厳しい戦いになっていくのか。それとも、onedayコンペみたいな、いかに早く精度良く作りあげるのができるかみたいな戦いになりそう。
Pythonパッケージ作成中
- とりあえず公開できた
- regonn/polar_bear
- Kaggleとかで、csvから読み取ったpandasのデータをそのまま渡すだけで、ワンホットとかnan値をいい感じで処理してくれるライブラリが欲しかった
- 使用感 polar_bear.ipynb
- とりあえずタイタニックで、そのまま csv_read した dataframe を渡せば、light_gbm とかで処理できる形にできる
- 現状タイタニックで正答率6割ぐらいで低めだけど敷居は下がった感じ
- 他のテーブルデータのコンテストでも試してみたい
- 名前はpandasをクレンジングしてくれるので白熊(polar_bear)と名付けた
- テストとかあんまりなくて、コードも汚いので特徴量エンジニアリング勉強しながらメンテしていきたい
Googleポッドキャストを使ってregonn&curry.fmを購読してみる - わかめの備忘録
- Googleポッドキャストは3倍速で聴ける
- iphoneのポッドキャストは最大2倍速なので、より早く聴けると思った
- 自分もGoogleポッドキャスト使ってる。
- そのまま記事部分も表示してくれるのでリンクも飛びやすい
- “Trim silence” を使うと無音を飛ばしてくれるからより早く聞けるけど、小さい”っ”とかも無音とみなされるので、ツイッターがツイターって聞こえてしまう。
Signateのランキング
今週のkaggle
- 新コンペ
- Santander Customer Transaction Prediction | Kaggle
- 特徴も少なく、匿名化されており誰でも参加しやすいコンペ
- ディスカッション では、8000人を超える参加者になるのではという予想もされていた
- Santander Customer Transaction Prediction | Kaggle
- カレー
- Eloコンペ
- Kernelをようやくこえることができた
- Eloコンペ
- れごん
- Kaggle の勉強会開催とライブラリ作って終わってた。
250 つのエピソード
Manage episode 227541589 series 2436384
コンテンツは regonn&curry によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、regonn&curry またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
Scrapbox
お題
fastai/fastprogress
- fastaiのプログレスバー
特徴量エンジニアリングの書籍がでるっぽい
uber/ludwig
- 米Uber、コードを書かずに深層学習モデルのトレーニングができるツール「Ludwig」を発表 | OSDN Magazine
- uberが出してきた、コードを書かずに機械学習ができるツール
- まだ、あまり情報や記事は出てきてない
- 今後こういうのが増えてきたら、Kaggleのスコアがベースアップしてきて、より厳しい戦いになっていくのか。それとも、onedayコンペみたいな、いかに早く精度良く作りあげるのができるかみたいな戦いになりそう。
Pythonパッケージ作成中
- とりあえず公開できた
- regonn/polar_bear
- Kaggleとかで、csvから読み取ったpandasのデータをそのまま渡すだけで、ワンホットとかnan値をいい感じで処理してくれるライブラリが欲しかった
- 使用感 polar_bear.ipynb
- とりあえずタイタニックで、そのまま csv_read した dataframe を渡せば、light_gbm とかで処理できる形にできる
- 現状タイタニックで正答率6割ぐらいで低めだけど敷居は下がった感じ
- 他のテーブルデータのコンテストでも試してみたい
- 名前はpandasをクレンジングしてくれるので白熊(polar_bear)と名付けた
- テストとかあんまりなくて、コードも汚いので特徴量エンジニアリング勉強しながらメンテしていきたい
Googleポッドキャストを使ってregonn&curry.fmを購読してみる - わかめの備忘録
- Googleポッドキャストは3倍速で聴ける
- iphoneのポッドキャストは最大2倍速なので、より早く聴けると思った
- 自分もGoogleポッドキャスト使ってる。
- そのまま記事部分も表示してくれるのでリンクも飛びやすい
- “Trim silence” を使うと無音を飛ばしてくれるからより早く聞けるけど、小さい”っ”とかも無音とみなされるので、ツイッターがツイターって聞こえてしまう。
Signateのランキング
今週のkaggle
- 新コンペ
- Santander Customer Transaction Prediction | Kaggle
- 特徴も少なく、匿名化されており誰でも参加しやすいコンペ
- ディスカッション では、8000人を超える参加者になるのではという予想もされていた
- Santander Customer Transaction Prediction | Kaggle
- カレー
- Eloコンペ
- Kernelをようやくこえることができた
- Eloコンペ
- れごん
- Kaggle の勉強会開催とライブラリ作って終わってた。
250 つのエピソード
すべてのエピソード
×プレーヤーFMへようこそ!
Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。