ブログ Blog
カテゴリー:コラム

AI(機械学習)プロジェクトの進行の勘所

AI(機械学習)プロジェクトの進行の勘所

現在 AI(機械学習)活用がブームになっています。様ざまな業態で、多様な活用事例が活発に発信されています。 一方でAI(機械学習)を利用したシステムを作る側が、「実際どのようにプロジェクトを進めて行くのか?」についてはあまり語られていないのが現状です。そこで、これから導入を進めていこうとしている方向けに、どのようにプロジェクトを進めていったらよいかの参考となるような記事を配信させていただこうと思います。

プロジェクトの工程について

一般的なプロジェクト開発は以下のように進められます。

開発するプロダクトの性質によってアジャイル型や、ウォーターフォール型の開発など 様ざまな方式での開発が行われるかと思います。

AI(機械学習)を利用したシステムを構築する場合は、PoCフェーズを挟みます。

PoCとは、Proof of Conceptの略で、「概念実証」という意味です。 新しい概念や理論、原理、アイディアの実証を目的とした、試作開発の前段階における検証やデモンストレーションを指します。

PoCは企画と要件定義の間の工程として入ります。

機械学習やAIを利用したシステムの場合、実際にモデルを構築してみないと本当に答えが出るかわかりません。事前にしっかりと時間をとって、設定したテーマが解決可能なのか調べて大体の初期モデルを作ったうえでビジネス適用を検討していく。プロジェクト成功の鍵を握っている重要な工程です。
場合によっては、思ったような成果が出ないため、プロジェクトを進めていくかどうかを判断する必要があります。 機械学習はデータがないと予測をすることができないので、人間が暗黙のルールでデータを判断している。データ化されていない知識を元に行われている業務があったとするとそもそも予測をすることができないですし、 学習に必要なデータが十分でないと、予測モデルの精度が出なくなってしまうことがあります。

PoCフェーズでの主なタスクは、CRISP-DMと呼ばれるプロセスモデルで理解すると分かりやすくなります。CRISP-DM(CRoss-Industry Standard Process for Data Mining)は、同名のコンソーシアムによって提唱されたデータ分析プロジェクトのプロセスモデルです。現在多くの専門家がこのモデルを採用しています。最近、日本語の解説記事も増えてきており、徐々に広がりつつあります。

参照元:CRISP-DM公式ページ http://crisp-dm.eu/

公式ページによれば、プロセス概要と詳細タスクの説明の記載があります。

(図1:提唱されているプロセスモデル)

こちらの図に書かれている、主なプロセスと概要について説明します。

プロセス

・ビジネスの状況の把握(Bussiness Understanding)
ビジネスの主要な目的を把握します。システム構築して何を解決したいのかを定義します。

・データの理解(Data Understanding)
実際に取り扱うデータについて知ります。基本的にはデータ項目、量、品質を調査します。 通常データ自体には欠損や異常値などもあるので、それを加味したうえで、本当に使えるデータなのか判断をします。 使えないという判断をした場合は、新たにデータを探索して使えるデータを探していくことになります。一般公開されているAPIの利用や、データの購入などを検討する必要があります。

・データの準備(Data Preparation)
データを実際に分析しやすい形に整形していく作業です。前処理と言われているもので、どういった解析(モデル作成)をするかによっても整形方法は変わってきます。
探索的に様ざまな前処理を試しながら前処理方法を決定していくことになります。ここで検討した前処理は実際のプロダクトで定常的に処理を回すことになりますので、 保守性・パフォーマンスなどを検討材料に入れながら最適な方法を探していきます。

・モデル作成(Modeling)
ここまでやってきてやっとAI(機械学習)の登場となります。 学術論文や最新の事例に基づいてどういった統計数学や、機械学習のモデルを利用して解析するのかなどを専門家の監修のもとで実装していくことになります。最近はPythonなどのライブラリ集で提供されている関数を利用することで簡単に実現することが可能となっていますので、実はこのフェーズではあまり工数はかかりません。

・評価(Evaluation)
設定したテーマを達成するに十分な精度が出ているのかをビジネスの観点から評価していきます。例えば、作成した予測モデルに対して結果の予測精度が業務で求められている精度(具体的な数値)に達しているのかを確認します。

・展開/共有(Deployment)
評価結果に基づき、 システムへ展開していく計画を行います。
ここからが要件定義スタートといった意味合いとなります。

今回説明した内容は概要レベルですが、プロセス・タスクを理解するには非常に良い手法となっていますので、 プロジェクトを進める際に参考にしています。

Summary

このように、PoCのフェーズを経ることで初めて、プロダクト開発のスタートラインに立つことができます。 ただし、気をつけなければならないのは、AI(機械学習)はシステム全体から見るとひとつの機能に過ぎないため、プロダクトを作るうえでは利用者のことを考えて、システム全体を設計していくことが必要となります。そのためにこの後は通常のシステム開発のプロセスに戻って、開発を進めていきます。

関連リンク

弊社が開発しているプロダクト

■ Per-SONAR
サイト来訪前の接触キーワードを分析することで、購買につながりやすい潜在層とインサイトを発見し、効果的なアプローチを実現するためのサービス
https://www.irep.co.jp/news/detail/id=29039/

■Weatherdio(ウェザディオ)
天候変化による広告パフォーマンス分析及び自動配信をするサービス
https://www.irep.co.jp/news/detail/id=44673/

現在アイレップではAI(機械学習)を利用したプロダクトを開発する仲間を募集しています。
興味がありましたら、こちらから問い合わせください。

株式会社アイレップ
マーケティングテクノロジー開発Unit マーケティングテクノロジー開発Division マーケティングテクノロジー開発グループ

林 貞光

主に、WEBアプリケーション開発のプロジェクトマネージャーから、 大規模サイトの保守・開発責任者を経験の後、 アイレップに入社。 現在はプロダクト開発のマネジメントをしつつ、 エンジニア組織の立ち上げを行う。 得意領域はスクラム開発や、DevOps導入による開発プロセス改善。アイレップに入社後は、 機械学習を利用したシステムの開発のマネジメントに従事。

この記事をSNSで
共有しませんか?
このエントリーをはてなブックマークに追加

アイレップをもっと詳しく知る

アイレップは、最新のデジタル技術と高度なマーケティング戦略を駆使し、クライアントビジネスにおける具体的なゴールを達成するパフォーマンス型のデジタルマーケティングエージェンシーです。この記事を見てアイレップに興味を持った方は、以下のコンテンツでより詳しく私たちについてご覧いただけます。

Blogその他のブログ記事