1. はじめに
面倒なマスタ更新、手作業でやっていませんか?
仕様書(ExcelやCSV)から必要な行だけを抽出し、データベース用のマスタのフォーマットに合わせて転記する作業……。
カラム名が日本語と英語で違ったり、列の並び順がバラバラだったりすると、手作業でのコピペはミスが起きやすく、非常にストレスが溜まります。
今回は、そんな面倒なデータ更新作業をGemini(AI)に任せて効率化した内容をご紹介します。
結論から言うと、Pythonのコードを一行も書かずに、自然言語の指示だけで簡単に正確なマスタ更新が完了しました!
2. 今回のお題(用意したデータとゴール)
今回私が直面したタスクは、以下のような内容でした。
- 用意したファイル1:マスタデータ.csv(既存のマスタデータ。)
- 用意したファイル2:更新データリスト.csv(追加する新規データが含まれる仕様書。)
どちらもファイル内データのカラム情報は対応しています。
達成したいゴール:
更新データリストの中から、特定の条件(新規追加分)のデータだけを抽出し、既存マスタのカラム構造にマッピングして、末尾に結合した新しいCSVを作成すること。
3. 実践編:Geminiとのやり取りのリアル
実際にGeminiに依頼した際のステップをご紹介します。一発で完璧というわけではなく、AIとの壁打ちの中でクオリティを上げていきました。
Step 1: まずはざっくり依頼してみる
ファイルを2つアップロードし、Geminiにこう指示しました。
「更新データリストの~行目以降のデータを抽出し、マスタデータの対応するカラムに追加して新しいCSVを作成してください。」
すると、Geminiが裏側でPython(pandas)を回し、サクッと結合ファイルを作成してくれました。手作業なら数十分かかるマッピングが数秒で完了です。
Step 2: 「念のためのチェック」で発覚した落とし穴
念のため次のように指示を出しました。
「既存のデータ(マスタの元々の行)が変わっていないか確認してください。」
すると、ここで小数点の丸め問題が発覚しました。
Pandasでデータ型を変換する際、一部の数値列の小数が、一律で整数型に変換され 0 (ゼロ)になってしまっていました。
これはデータ処理アルゴリズムにおける「あるあるな罠」ですが、Gemini自身に比較テストを行わせることで未然に防ぐことができました。
Step 3: さらなる微調整(要件の追加)
- 「~列は小数のままでいいけど、他の数値カラムは綺麗な整数にしてください。」
- 「新しく追加したデータのidは続きの連番を振って、~idは全部1にしてください。」
これらの細かいフォーマット指定や一括処理の追加依頼も、チャットで伝えるだけで瞬時に修正対応が完了しました。
4. メリット
AIにマスタ更新を任せることには、以下のような大きなメリットがあります。
- 工数削減: 手作業でコピペをしていた時間がゼロになる
- コードを書かなくていい: pandasのconcatや欠損値処理など、面倒なスクリプトを自分で書く必要がない。
- 再現性が高い: 一度成功したプロンプトや処理の流れを残しておけば、今後の更新作業に活用できる。
5. まとめと今後の展望:AIは「優秀な助手」だが「最終責任者」ではない
手作業でコピペをしていた時間は「ゼロ」になり、作業の心理的ハードルは劇的に下がりました。Geminiは間違いなく超優秀なアシスタントです。
しかし、今回のStep 2で起きたような「予期せぬ型変換(小数の丸め込みなど)」が起こる可能性は常に潜んでいます。
だからこそ、「人の目による念入りなチェック」は絶対に省いてはいけません。
生成されたデータをそのまま本番環境に投入するのではなく、「差分比較」や「既存データに影響がないかの検証」は必ず人間が入念に行う必要があります。
AIに「作業(Do)」を任せ、人間は「検証・判断(Check & Action)」に集中する。これがこれからのデータ運用やバックオフィス業務のベストプラクティスだと感じました。
皆さんもぜひ、AIとの協業と「念入りなレビュー」をセットにして、面倒なCSV作業の自動化を試してみてください!