🐼Pandas応用編｜groupby・merge・グラフ描画まで使いこなす実践ガイド

🐼 Pandasを応用レベルで使えると、データ分析が一気に楽しくなる
📊 groupbyでデータをまとめて集計する
- 🔢 使える集計関数いろいろ
- ⚠️ 欠損値（NaN）の扱いに注意
🔁 インデックス操作を自在に
🔗 複数のデータフレームを結合する
- 📚 concat：縦・横にそのまま連結
- 🗝 merge：キーを使った賢い結合
🧪 mapとラムダ式でカスタム列を作る
📈 データフレームから直接グラフを描く
📚 Pandasを使いこなすためのおすすめ書籍
❓ よくある質問（FAQ）
✨ まとめ：Pandas応用テクで「分析できる人」へ

🐼 Pandasを応用レベルで使えると、データ分析が一気に楽しくなる

Pythonでデータ分析や業務効率化をするとき、必ずと言っていいほど登場するのが Pandas（パンダス） です。基本的なデータフレームの作り方や読み込みは知っていても、「複数のデータをまとめて集計する」「複数のCSVを結合する」「グラフでパッと可視化する」といった応用テクニックを使いこなせると、業務スピードが何倍にも変わります。

売上データを担当者ごとに自動集計したり、複数のシステムから出てきたCSVを1つにまとめたり、Excelでは時間がかかる集計を数行のコードで終わらせたり。そんな未来を引き寄せるための応用テクを、動画の内容に沿って整理しました。✨

📊 groupbyでデータをまとめて集計する

「担当者ごと」「曜日ごと」「商品カテゴリごと」のように、ある列の値でグループ化して集計したいときに使うのが groupby です。たとえば8月の売上実績データから、担当者ごとの1日あたりの平均売上を出したいとします。

書き方はとてもシンプルで、df.groupby("担当者").mean() のように、第1引数にグループ化したい列名を指定し、続けて集計用のメソッドを呼び出すだけ。これだけで佐藤さんの平均、斉藤さんの平均、田中さんの平均がパッと表示されます。便利すぎますよね。🎯

🔢 使える集計関数いろいろ

📈 mean()：平均値
🔝 max() / min()：最大値・最小値
➕ sum()：合計
🔢 count()：件数

数値以外の列が混ざっているときは、numeric_only=True を指定すると数値列だけを対象に集計してくれます。エラーで止まらず、必要なデータだけスッキリ取り出せます。

⚠️ 欠損値（NaN）の扱いに注意

集計関数は、列ごとにNaNを除外してから計算します。たとえば金曜日の売上が1件だけ欠損していると、count() の結果も他の列より1件少なくなります。「数が合わない…」と思ったら、まずNaNの有無を疑ってみましょう。🧐

🔁 インデックス操作を自在に

データフレームのインデックスは、後から自由に変更できます。地味ですが、表計算で言う「並べ替え」「キー設定」に相当する大事な操作です。

🆕 df.index = [...]：リストやSeriesでインデックスを丸ごと置き換え。
🏷 df.columns = [...]：カラム名を一括変更（日本語→英語のリネームに便利）。
🔑 df.set_index("列名", inplace=True)：既存の列をインデックスに昇格。
🔄 df.reset_index(drop=True, inplace=True)：インデックスを0から振り直してリセット。

inplace=True を付けると元のデータフレーム自体が書き換わり、付けないと新しいデータフレームが返ってくる、という違いも押さえておくと混乱しません。

🔗 複数のデータフレームを結合する

📚 concat：縦・横にそのまま連結

pd.concat([df1, df2]) でデータフレームをそのまま連結できます。デフォルトは縦方向、axis=1 を指定すると横方向の連結になります。3つ以上のデータフレームをまとめて渡せるのもポイントです。

連結時に片方にしかない列がある場合、その部分はNaNで埋められます。「データが消えた」のではなく、「もう片方になかったから空欄」と考えると分かりやすいです。📝

🗝 merge：キーを使った賢い結合

SQLのJOINに相当するのが pd.merge。共通のキー（例：ユーザーID）を指定して、横方向にデータを結合します。

🤝 inner（既定）：両方にあるキーだけ残す。
⬅️ left：左のデータをすべて残し、右にないキーはNaN。
➡️ right：右のデータをすべて残し、左にないキーはNaN。
🌐 outer：両方の和集合。どちらかにしかないキーもすべて残す。

使い方は pd.merge(df1, df2, on="ユーザーID", how="left") のように、on でキー、how で結合方式を指定。3つ以上を一度には結合できないので、2つずつ繰り返すのがコツです。🔁

🧪 mapとラムダ式でカスタム列を作る

「20歳以上なら成人、それ未満なら未成年」のような条件付きの新しい列を作りたいときは、map とラムダ式の組み合わせが強力です。

たとえば df["区分"] = df["年齢"].map(lambda x: "成人" if x >= 20 else "未成年") と書くだけで、年齢列の各値が順番にラムダ式に渡され、結果が新しい列として追加されます。Excelの IF 関数を一気に全行に適用するイメージですね。⚡

📈 データフレームから直接グラフを描く

￥4,620（2026/07/22 10:32時点）

❓ よくある質問（FAQ）

🤔 Q1. groupbyで複数の列をキーにできますか？

はい、df.groupby(["担当者", "曜日"]) のようにリストで複数列を指定すると、組み合わせごとにグループ化されます。クロス集計に近いことが手軽にできます。

🔗 Q2. concatとmergeはどう使い分ければいい？

同じ形のデータをそのままつなげるなら concat、共通のキーで関連付けて結合するなら merge、と覚えると分かりやすいです。SQLに慣れている方には merge がJOINと同じ感覚で使えます。

⚠️ Q3. 欠損値（NaN）が混ざると集計結果が変になります

多くの集計関数はNaNを自動で除外するため、列ごとに件数や平均が変わることがあります。必要に応じて fillna() で値を埋めるか、dropna() で行を除外してから集計しましょう。

🐌 Q4. 大量データだと処理が遅いです

ベクトル化された操作（map、apply よりも純粋なPandas/NumPy演算）を使う、不要な列を早めに削る、データ型を最適化する、といった工夫で速くなります。それでも遅ければ Polars や Dask への移行も選択肢です。

🎨 Q5. グラフの日本語が文字化けします

matplotlib単体だと日本語フォントの設定が必要ですが、japanize-matplotlib をインストールして import japanize_matplotlib を1行書くだけで自動解決できます。手軽でおすすめです。

✨ まとめ：Pandas応用テクで「分析できる人」へ

Pandasの基本に groupby・concat・merge・map・plot を加えるだけで、扱えるデータの幅と分析の深さが一気に広がります。Excelで手作業していた集計やグラフ作成が、数行のコードで自動化できる。これが応用編の醍醐味です。🚀

最初は引数や使い分けで迷うかもしれませんが、書籍で体系的に学びながら手を動かせば、必ず体に染み込みます。今回紹介した書籍を相棒に、あなたのデータ活用スキルを次のステージへ引き上げてみてください。📚

あざらし

はじめまして、あざらしです。フリーターからエンジニア会社へ就職し、現在はフリーランスのシステムエンジニアとして働いています。本業のエンジニア業のかたわら、 ✍️ ブログ運営と「収入の柱を増やす挑戦」を少しずつ続けています。フリーター時代から比べると、段階的に収入が増えていくのを実感できるのが素直にうれしい今日この頃。このブログでは、日々の気づき・体験談 IT・ガジェット・ゲーム系の話「調べて分かったこと」を噛み砕いた解説などを中心に、ジャンルに縛られない雑記ブログとして発信しています。「自分と同じように悩んでいる人のヒントになればいいな」そんな気持ちで更新中です。 👉 プロフィール詳細は、名前「あざらし」をクリックしてください

Next 🐍Python組み込み関数を完全マスター！学習効率を爆上げするおすすめ書籍5選 »

Previous « 🐍Pythonの賛否両論コード4選｜書き方の正解は1つじゃない

🐼Pandas応用編｜groupby・merge・グラフ描画まで使いこなす実践ガイド

🐼 Pandasを応用レベルで使えると、データ分析が一気に楽しくなる

📊 groupbyでデータをまとめて集計する

🔢 使える集計関数いろいろ

⚠️ 欠損値（NaN）の扱いに注意

🔁 インデックス操作を自在に

🔗 複数のデータフレームを結合する

📚 concat：縦・横にそのまま連結

🗝 merge：キーを使った賢い結合

🧪 mapとラムダ式でカスタム列を作る

📈 データフレームから直接グラフを描く

📚 Pandasを使いこなすためのおすすめ書籍

🐼 Pandasの決定版テキスト

📊 実務でそのまま使える前処理レシピ

🤖 機械学習につなげたい人へ

🎨 データ可視化を一段上のレベルに

🚀 業務効率化・自動化を狙う人へ

❓ よくある質問（FAQ）

🤔 Q1. groupbyで複数の列をキーにできますか？

🔗 Q2. concatとmergeはどう使い分ければいい？

⚠️ Q3. 欠損値（NaN）が混ざると集計結果が変になります

🐌 Q4. 大量データだと処理が遅いです

🎨 Q5. グラフの日本語が文字化けします

✨ まとめ：Pandas応用テクで「分析できる人」へ

Recent Posts

⚠️【重要】Windows11更新KB510650の注意点！Dellユーザーは絶対確認を

🚀AIで「1人会社」を実現！個人が月収450万を稼ぐ次世代の働き方とは？

📉AI半導体バブル崩壊の兆候？激変する相場で勝ち残るための投資戦略と必須ツール

🚀【2025年最新】AIコーディングエージェント徹底比較！Fable・Claude Code・Grokの最適解とは？

🚀【革命的】GPT5.6登場！AIエージェントで仕事のやり方が激変する未来とは？

目黒蓮の圧倒的市場価値とは？世界が「1分」で決断した驚愕の理由を徹底解説✨

🐼Pandas応用編｜groupby・merge・グラフ描画まで使いこなす実践ガイド

🐼 Pandasを応用レベルで使えると、データ分析が一気に楽しくなる

📊 groupbyでデータをまとめて集計する

🔢 使える集計関数いろいろ

⚠️ 欠損値（NaN）の扱いに注意

🔁 インデックス操作を自在に

🔗 複数のデータフレームを結合する

📚 concat：縦・横にそのまま連結

🗝 merge：キーを使った賢い結合

🧪 mapとラムダ式でカスタム列を作る

📈 データフレームから直接グラフを描く

📚 Pandasを使いこなすためのおすすめ書籍

🐼 Pandasの決定版テキスト

📊 実務でそのまま使える前処理レシピ

🤖 機械学習につなげたい人へ

🎨 データ可視化を一段上のレベルに

🚀 業務効率化・自動化を狙う人へ

❓ よくある質問（FAQ）

🤔 Q1. groupbyで複数の列をキーにできますか？

🔗 Q2. concatとmergeはどう使い分ければいい？

⚠️ Q3. 欠損値（NaN）が混ざると集計結果が変になります

🐌 Q4. 大量データだと処理が遅いです

🎨 Q5. グラフの日本語が文字化けします

✨ まとめ：Pandas応用テクで「分析できる人」へ

Related Post

Recent Posts

⚠️【重要】Windows11更新KB510650の注意点！Dellユーザーは絶対確認を

🚀AIで「1人会社」を実現！個人が月収450万を稼ぐ次世代の働き方とは？

📉AI半導体バブル崩壊の兆候？激変する相場で勝ち残るための投資戦略と必須ツール

🚀【2025年最新】AIコーディングエージェント徹底比較！Fable・Claude Code・Grokの最適解とは？

🚀【革命的】GPT5.6登場！AIエージェントで仕事のやり方が激変する未来とは？

目黒蓮の圧倒的市場価値とは？世界が「1分」で決断した驚愕の理由を徹底解説✨