「Polars、試してみた? Pandasからの移行、あり?なし?」~【python】今週の人気記事TOP5(2025/09/07)
【2025/9/7】「Polars、試してみた? Pandasからの移行、あり?なし?」今週の人気記事TOP5(2025/09/07)
C/C++の世界に閉じこもっていたオジサンがPythonに触れてみる ~基礎編~ 第3/10回
C/C++経験豊富なエンジニアがPythonに触れた際の戸惑いと発見が語られています。Pythonでは変数の型定義が不要なため、柔軟な記述が可能である一方、型エラーに気づきにくいという問題に直面します。しかし、Python 3.5以降の型ヒント機能により、引数に型情報を付与できることを知り、C++との違いに苦しみつつもPythonへの理解を深めていく過程が描かれています。
AIエンジニアリング入門:Pythonによる開発の基礎(uv, Ruff, dataclass, Pyright, Git hooks)
データサイエンス事業におけるAIエンジニアリングスキル習得を目的とした記事です。
Python開発におけるプロジェクト管理とコード品質維持のためのプラクティスを紹介します。
プロジェクト管理には高速なパッケージ管理ツールuvを使用し、venv、poetry、pyenvなどの代替とします。
コード品質管理にはRuffを使用し、コードの静的解析、フォーマットを行います。
また、Pythonの型ヒントとdataclassを活用し、Pyrightで型チェックを実施します。
さらに、Git hooksとpre-commitを使い、コード解析と型チェックを開発ワークフローに組み込みます。
開催報告:【第一回】ケモインフォマティクス×ハッカソン合宿 in 横浜
ケモインフォマティクス分野のハッカソン合宿が横浜で開催されました。参加者はAIやデータサイエンスを活用し、化合物の毒性予測をテーマにチームで課題に取り組みました。ショートプレゼンやBBQ、ボードゲーム等を通じて交流を深め、最終日に成果報告会を実施。最優秀チームが表彰されました。次年度は自然言語処理とケモインフォマティクスの融合をテーマに開催予定です。
「Pandas使うよりPolarsの方がいいよ」は本当かもね??
大規模データ処理において、PolarsがPandasより高速であるか検証した記事。数十万~数百万件のCSVファイルを結合する処理を、PolarsとPandasで実装し実行時間を比較した結果、Polarsの方が大幅に高速だった。Polarsはマルチスレッドで動作する点がPandas(シングルスレッド)より優れている。状況によってPandasの利用も検討しつつ、今後はPolarsの利用を検討するとのこと。
timm で画像の前処理を定義する
この記事では、timmライブラリを用いた画像前処理の方法を解説します。
-
timm.data.create_transform()
による簡単な前処理定義: 画像サイズ指定、データ拡張有無、正規化パラメータなどを設定可能。 - 事前学習済みモデルの前処理利用:
timm.data.resolve_model_data_config()
とcreate_transform()
の組み合わせで、モデル学習時の前処理情報を取得し適用。
これにより、ImageNetの正規化パラメータ取得や、モデルに合わせた適切な前処理を容易に実現できます。
Discussion