Activity 04T・AI~驚異の成果を生む 発注・生産・在庫管理AI

予測誤差を生かして生産性向上T・AI(時間の人工知能)入門

T・AI(時間の人工知能)入門

T・AIは、発注管理、生産管理、在庫管理において、省力化、欠品率低下、在庫削減など大きな生産性向上を実現します。
人の抵抗がない限り、その成果はめざましいものがあります(※)。 
何故そうなるのか不思議に思われるかも知れません。
生産性向上を支える中核部分が数理公式によっているからなのです。
統計学や数学の難しい部分を避け、文章、図、事例を通じて平易な説明を試みました。

(※) 「日本の在庫を減らそう」2014年11月ビューコミュニケーションズ編 P13, 14, 47参照

1. とかく予測はいい加減
(1) 予測トラップはよく起こる
(2) 事例:食品Aの年末過大予測

2. 必ずハズれる予測を科学する
(1) 時系列解析の見方は
~時系列解析とホワイトノイズ(WN)分散
(2)  WN分散が大とは
(3) 循環・トレンドをどう扱うか
(4) 最適予測モデルの選択とは
(5)  事例:リビング用品Bの販売予測例
(参考) 予測基本手順

3. WNこそ在庫(新在庫理論)
(1) 誤差制御の重要性
(2) 誤差制御、累積誤差、安全在庫、平均在庫の関係性
(3) 最適モデルと次善モデルの在庫の違い

1-(1)とかく予測はいい加減~予測トラップはよく起こる~

現代の科学では、100%正しい予測を行うことは不可能です。しかし、私達は知らずのうちに“100%予測こそが正”としがちです。また予測に際し多くのエラーもします(予測トラップ)。

①多くのファクター(要因)から予測しようとすること

私達は、何らかの理由をつけ結果を説明したがるものです。
予測に際しても、多くの要因(ex過去販売実績、天候、競合品、税制改正、
地政学リスク等)を考えて行いがちです。しかし、各要因ごとに誤差を持ち、
それらが重なることで予測精度は悪くなるものです。
このため、多変量予測よりも単一変量予測の方が優れているのが通常です。

②勘と経験による人の予測

願望、思い込み、錯誤、危険回避などの心理により
過大・過少予測を行うのが人の常です

③需要予測は外れると怒られますが、実は怒る側にこそ誤りがあります

予測の中には必ず予測不能部分(ホワイトノイズ)が含まれるので、予測は外れるものです。

1-(2)とかく予測はいい加減~事例:食品Aの年末過大予測~

この会社では、商品Aの販売変動について、毎年11、12月は販売が急増するといったシーズン性があると見ていました。
担当者は、2017年12月の販売量を前年同月に対し増加すると予測していました(10,700と予測)。
単純にこのグラフを見ると、多くの人は販売増加傾向を見て取ることでしょう。その意味でこの担当者の予測は概ね的を得ていると考える事でしょう。
答えを先に言えば、多くの会社で用いられる対前年比主義では、しばしば増加傾向を錯覚してしまうことがあるという事例です。

解説を加えていくこととします。
まず、12月だけ取った図を作ってみるとグラフのようになります。このグラフからは販売増加傾向はかなり消失しています。

さらに続けて前年同月差分の図を作ってみると、増加傾向どころか減少傾向が明瞭となります。つまり、2017年12月の販売量は前年同月を下回ると推測されることとなります。

時系列解析を用いて予測を行ってみます。過去の販売実績データ系列から推定されたモデルは次式でした。

?(?) = 0.939510 ?(?−1) + ?(?) −0.634854 ?(?−1)

この式より2017年12月の予測値は8,492となり、前年同月販売量9,508よりも減少する結果が得られました。

後日判明した実績値も8,805と減少していました。

このように「人の予測では増加でしたが、科学的予測では減少する」という正反対の結果を導くことがしばしばあります。

2-(1)必ずハズれる予測を科学する~時系列解析とWN分散~

科学的予測というと、物理的・化学的・生物学的法則(万有引力の法則、メンデルの法則等)に基づいて予測する方法が浮かびます。しかし、多くの経済現象は、ファクターの数が多く、その相互関係も不明な場合が非常に多いので、法則を捉えることは困難です。
そこで、観測値(販売量、生産量、在庫量、GDP、人口、等)を確率的に発生した値と捉えて科学的に予測する時系列解析が生まれました。
時系列解析とは、時間とともに観測されたデータ(時系列データ )が与えられた時に、次式より将来の値を予測しようとするものです。

この方程式はARIMA(自己回帰移動平均統合)モデルと呼ばれ、観測データより、パラメーターを推定し、将来の予測値を求めます。
規則的変動については、パラメーター推定を正確に行うことで予測精度は確保されますが、(不規則変動)については予測不能なので、予測は、 の部分だけ必ずハズれるという事になります。
不規則変動 は、ホワイトノイズ(WN)と呼ばれ、統計的には平均0、分散一定と定義され、パラメーター推定の過程で、その分散値が計算されます(各時点の値は不明)。
したがって、この予測方程式は予測不能部分を明らかにした予測式とも言えるのです。

キャラ

2-(2)必ずハズれる予測を科学する~WN分散が大とは~

図2

の分散を調べると、商品や市場によってその大きさはバラバラです。つまり の分散が大きいと予測精度は著しく悪化します。

(注) (WN)の分散大の数式上の意味合い
最も基本のAR(1)モデルで考えてみます。実際の観測データより計算される結果から、 の分散の大部分をの分散で占められていたり、 の分散を上回る の分散が生じたりすることがよくあります。このような場合、短期変動 はランダムな変動(不規則変動)で、短期的予測は不能となります。
尚、分散 , のバラつきの程度を示す統計量です。

図2は、短期的にランダムに上下変動が著しい(WNの分散大)場合をあらわしています。このような場合、短期的な上下変動は予測不能なので、無理矢理予測すると極端に大きな予測誤差が生じてしまいます。
したがって短期変動は、予測不要と考え、中長期変動を捉えようと考えることとなります(図2’)

(注)中長期変動モデルについては各種移動平均を用います。

図2'

2-(3)必ずハズれる予測を科学する~循環・トレンドをどう扱うか~

先の方程式には、循環やトレンドといった変動が含まれていません。それは、循環・トレンドをもった原系列に対し、様々な差分系列を作ることによって原系列からそれらを除去できるからです。
原系列の予測をするには、差分系列に対して、方程式を考え、予測しその予測値に差をとる前の値を加算(和分)すればよいことになります。

先の方程式には、循環やトレンドといった変動が含まれていません。それは、循環・トレンドをもった原系列に対し、様々な差分系列を作ることによって原系列からそれらを除去できるからです。<br />
原系列の予測をするには、差分系列に対して、方程式を考え、予測しその予測値に差をとる前の値を加算(和分)すればよいことになります。<br />

2-(4)必ずハズれる予測を科学する~最適予測モデルの選択とは~

以上より、短期変動、中長期変動、循環、トレンドなど様々な予測モデルが考えられることになります。
概略として、どれくらい前の時点(先の方程式のp時点、q時点)の値と関係していたか、どんな中長期周期性をもつか、差分系列はどんな組み合わせか考えられるかなど、数百通りの予測モデルが考えられます。
したがって、これらの中からベストなモデルを1つ選択する必要があります。
この選択基準として有名なのがAIC(赤池情報量基準)で厳密性と単純性から成る統計基準です。改良型基準も工夫されて、モデル選択の理論標準とされています。
しかし、これらの統計基準は実用上は不十分で、利益最大、在庫最小などの実用基準を上位に捉えることが必要となります。

以上より、短期変動、中長期変動、循環、トレンドなど様々な予測モデルが考えられることになります。<br />
概略として、どれくらい前の時点(先の方程式のp時点、q時点)の値と関係していたか、どんな中長期周期性をもつか、差分系列はどんな組み合わせか考えられるかなど、数百通りの予測モデルが考えられます。<br />
したがって、これらの中からベストなモデルを1つ選択する必要があります。<br />
この選択基準として有名なのがAIC(赤池情報量基準)で厳密性と単純性から成る統計基準です。改良型基準も工夫されて、モデル選択の理論標準とされています。<br />
しかし、これらの統計基準は実用上は不十分で、利益最大、在庫最小などの実用基準を上位に捉えることが必要となります。<br />

在庫最小というモデル選択のための実用基準は、ホワイトノイズの重要性を示すものでもあります。
予測誤差 = ホワイトノイズですから、証明は省略しますが(注)、リードタイム累積誤差 = 安全在庫(欠品0条件) ≒ 平均在庫という新在庫理論の公式より、ホワイトノイズ(分散値)が正確に計算されるモデルであることが重要となります。
(これまでの多くの予測モデルは計算経済性の観点もあり、ホワイトノイズ(分散値)の計算を省いた簡便モデルが採用されてきました)。

(注) 「日本の在庫を減らそう実用ARIMA」2014年11月ビューコミュニケーションズ編 P44,45参照

【まとめると】
どんなに科学的に精微なモデルを作ってもWNの存在により予測は必ずはずれます。しかし、一方はずれを表わすWNの分散を厳密に計算することで、在庫最小という目的が実現できることにつながるのです。
したがって、在庫が最小となる予測を求めるためには、WNが正確に計算された予測モデルとなっている必要があるのです。

【参考:予測の流れ】

2-(5)必ずハズれる予測を科学する~事例:リビング用品Bの販売予測例~

①販売実績

下図はリビング用品Bの週次販売実績データ
(2014年8月第33週~2017年12月第50週、全174週)です。

②使用するモデルタイプ(差分系列タイプ)と使用する全52回の逐次更新予測

直近1年間(シミュレーション期間)で、全てのモデルタイプにつき全52回のパラメーター推定計算を行います。パラメーター推定計算は、WN分散計算の必要から厳密最尤法(DFP法)を用いますが、やや難しいので説明は省略します。
例えば、D52で52回目の推定結果は

X(t) = 0.095716 X(t-1) +0.014715 X(t-2) +0.480717 X(t-3) + Z(t)

で、0.095716などのパラメーターを毎回計算することとなります。
尚、T・AIに実装されているコンピュータープログラムでは、1モデル1回のパラメーター推定計算に要する時間は0.03秒程度となっており、実用上十分な速さを持っています。
各モデルタイプの予測シミュレーション結果は下図の通りです。

直近1年間(シミュレーション期間)で、全てのモデルタイプにつき全52回のパラメーター推定計算を行います。パラメーター推定計算は、WN分散計算の必要から厳密最尤法(DFP法)を用いますが、やや難しいので説明は省略します。<br />
例えば、D52で52回目の推定結果は<br />
<br />
X(t) = 0.095716 X(t-1) +0.014715 X(t-2) +0.480717 X(t-3)  + Z(t) <br />
<br />
で、0.095716などのパラメーターを毎回計算することとなります。<br />
尚、T・AIに実装されているコンピュータープログラムでは、1モデル1回のパラメーター推定計算に要する時間は0.03秒程度となっており、実用上十分な速さを持っています。<br />
各モデルタイプの予測シミュレーション結果は下図の通りです。<br />
<br />

③どのモデルタイプがベストかの選択

上の表より、1年間のシミュレーション結果では在庫基準からD52がベストとなります。

*在庫理論の公式
平均在庫=安全在庫=| リードタイム累積誤差の最小値 | なので
シミュレーション期間の各週の予測誤差より3週累積誤差を計算して求める

**しばしばこの値(予測誤差の標準偏差)をもってモデルを選んでしまいがちです。
この場合ではD1が選ばれてしまいます。後述するようにD1では在庫が最小とならずベストなモデルとは言えないのです。

④実際に各モデルを運用した結果

シミュレーションではなく、実際運用を想定し、2018年1週~12週の期間で各モデルを適用してみました。各モデルの予測結果(予測誤差)をまとめたのが上表です。
予測誤差の標準偏差では、D1ではなくD52が望ましい結果となっています。
では在庫はどうなったでしょうか、次節で見ていくことにします。

3-(1)WNこそ在庫 新在庫理論~誤差制御の重要性~

ここまで、平均在庫=安全在庫=|リードタイム累積誤差の最小値|と述べてきました。 実例を通じてこの公式の意味を説明しましょう。事例としては、先のリビング用品Bの販売予測2018年1月1週~3月12週モデルD52を用います。

ここまで、平均在庫=安全在庫=|リードタイム累積誤差の最小値|と述べてきました。 実例を通じてこの公式の意味を説明しましょう。事例としては、先のリビング用品Bの販売予測2018年1月1週~3月12週モデルD52を用います。

①2018年1月1週の予測値22 の意味

過去の販売実績(2017年12月50週まで174週)を用いて、リードタイム3週として1月1週に販売するであろう値をD52モデルのもとパラメーター推定して求めたものです。

予測、生産、リードタイムの関係は右図のように考えています。

②予測誤差の制御( 1月1週 予測値22-販売実績30=8)

WNの存在により予測は必ずハズれ、たまたま1月1週の予測誤差は-8となっています。
22という予測値を正しいと考え生産したわけですが、実際には30販売したので8だけ生産不足が発生したのです。次の生産指示量に8だけ生産を増やすことが必要となります(販売実績に生産を合わせて行く)。ただし、この8はリードタイムが3週なので、1月4週目に販売可能となるよう1月3週目で追加生産されます。
したがって、4週目の販売可能量は、予測値354+予測誤差調整量8=362(この分だけ3週目に生産されている)となります。

※このような誤差調整は|マイナス調整量|が予測値を上回ってしまうことが発生します。この場合は、113-274=-162が未調整分となり、(予測量+本来の誤差調整量)にこの未調整分を加える必要があります。
226 + 456 -162 = 520

③安全在庫と各週の在庫と平均在庫

最適モデル計算時に、シミュレーション期間(1年間)を通じて欠品0となる初期在庫を計算してあり、それが安全在庫と定義されます。この場合(D52)、651がその値でした。
実際の運用に当っては、必ず実際の在庫をこの安全在庫に合わせるよう生産量の調整(安全在庫ー実際在庫)が行われます。
この事例では、2017年12月52週末の段階でこの調整がなされており実際在庫=安全在庫=651となっています。
よって各週末の在庫は、前週末在庫+当週出荷可能量(生産済量)ー当週販売量と計算されます。
そして各週末の在庫の平均が平均在庫となります。在庫変動は一般に激しいので、瞬間在庫ではなく、この平均在庫をみることが大切です。

3-(2)WNこそ在庫 (新在庫理論)~誤差制御、累積誤差、安全在庫、平均在庫の関係性~

やや一般化して考えてみます。

やや一般化して考えてみます。

上表から、平均在庫=在52(前述の651)+(誤i−2+誤i−1 +誤i )となるので、(誤i−2+誤i−1 +誤i )≒0(誤差はWNでΣ誤≒0)
に気をつけると、平均在庫=在52=理論安全在庫となります。

また、誤差制御をすると、表のように各時点の在庫は、初期在庫+(誤n−2+誤n−1 +誤n) と表せるので、欠品=0⇔在庫>0 とおくと、3週累積誤
差の最小値の絶対値だけ初期在庫を持っていれば良いとなります。つまり、この初期在庫を理論安全在庫と呼ぶのです。以上まとめると、新在庫理論の公式

|リードタイム累積誤差の最小値|=理論安全在庫=平均在庫が導けたこととなります。      

 

 

3-(3)WNこそ在庫 新在庫理論~最適モデルと次善モデルの在庫の違い~

在庫基準で選択されたD52と誤差標準偏差基準で選択されたD1をくらべてみました(下図表)。
やはり、D52の方が平均在庫が小さくなることが示されています。

このように、予測誤差標準偏差基準でモデルを選んでしまうと在庫最小とならないことが示されています。
在庫最小基準が実用上必要となることが理解されたことと思います。

(注)この事例では検証期間が12週と短いため、本来のWN平均=0が実現していませんが、結論に変わりはありません。

調査・研究データ

  • 特許第4981976号「変動値予測システム、在庫管理システム、プログラム、記憶媒体」
  • 特許第5698860号「在庫管理システム、在庫管理方法、およびプログラム」