デシジョンツリーとランダムフォレストの違い

目次:

Anonim

NS 主な違い 決定木とランダムフォレストの間は デシジョンツリーは、分岐方法を使用して決定のすべての可能な結果を​​示すグラフです。一方、ランダムフォレストは、すべてのデシジョンツリーの出力に基づいて最終結果を与える決定ツリーのセットです。

機械学習は人工知能のアプリケーションであり、システムに過去の経験に基づいて学習および改善する機能を提供します。決定木とランダムフォレストは、機械学習の2つの手法です。デシジョンツリーは、一連の関連する選択の可能な結果を​​マップします。シンプルでわかりやすいので人気です。データセットがはるかに大きくなると、単一の決定木では予測を見つけるのに十分ではありません。決定木のコレクションであるランダムフォレストは、この問題の代替手段です。ランダムフォレストの出力は、そのすべての決定木の出力に基づいています。

デシジョンツリー、機械学習、ランダムフォレスト

デシジョンツリーとは

デシジョンツリーは、アクションのコースを決定するために使用されるツリー形状図です。ツリーの各ブランチは、考えられる決定、発生、または反応を表します。

デシジョンツリーに関連するいくつかの用語があります。エントロピーは、データセットの予測不可能性の測定値です。データセットを分割した後、予測不可能性が減少するにつれて、エントロピーレベルが減少します。情報ゲインは、データセットを吐き出した後のエントロピーの減少です。情報ゲインが高くなるようにデータを分割することが重要です。最終決定または分類は、リーフノードと呼ばれます。最上位またはメインノードはルートノードと呼ばれます。最終的なエントロピーがゼロになるまで、データセットを分割する必要があります。

簡単な決定木は次のとおりです。

図1:デシジョンツリー

上記の決定木は、果物のセットを分類します。ぶどう4個、りんご2個、オレンジ2個あります。直径が5未満の場合、ブドウは片側に分類され、オレンジとリンゴは反対側に分類されます。ブドウはエントロピーがゼロであるため、これ以上分類することはできません。色、つまりフルーツレッドが赤であるかどうかに基づいて分類する場合、リンゴは一方の側に分類され、オレンジはもう一方の側に分類されます。したがって、この決定木は、リンゴ、ブドウ、またはオレンジを100%の精度で分類します。

全体として、デシジョンツリーは理解しやすく、解釈と視覚化が容易です。多くのデータ準備は必要ありません。数値データとカテゴリデータの両方を処理できます。一方、データのノイズは過剰適合を引き起こす可能性があります。さらに、モデルは小さな変動のために不安定になる可能性もあります。

ランダムフォレストとは

ランダムフォレストは、トレーニングフェーズ中に複数の決定木を構築することによって機能する方法です。大多数の木の決定は、ランダムフォレストの最終決定です。簡単な例は次のとおりです。

果物のセット(サクランボ、リンゴ、オレンジ)があると仮定します。以下は、これら3つのフルーツタイプを分類する3つの決定木です。

図2:デシジョンツリー1

図3:ディシジョンツリー2

図4:ディシジョンツリー3

直径3の新しい果物がモデルに与えられます。この果実はオレンジ色で、夏に育ちます。最初の決定木はそれをオレンジとして分類します。 2番目の決定木はそれをチェリーとして分類し、3番目の決定木はそれをオレンジとして分類します。 3つのツリーすべてを考慮すると、オレンジには2つの出力があります。したがって、ランダムフォレストの最終出力はオレンジ色になります。

全体として、ランダムフォレストは、より大きなデータセットで正確な結果を提供します。また、過剰適合のリスクを軽減します。

デシジョンツリーとランダムフォレストの違い

意味

意思決定ツリーは、ツリーのようなグラフまたは意思決定のモデルと、偶然の出来事の結果、リソースコスト、ユーティリティなど、考えられる結果を使用する意思決定支援ツールです。ランダムフォレストは、トレーニング時に多数の決定木を構築し、個々のツリーに応じてクラスを出力することによって動作するアンサンブル学習方法です。

過剰適合

デシジョンツリーに過剰適合する可能性があります。ランダムフォレストで複数の木を使用すると、過剰適合のリスクが軽減されます。

正確さ

ランダムフォレストは、決定木よりも正確な結果をもたらします。

複雑

デシジョンツリーは、比較的複雑なランダムフォレストよりも単純で、理解、解釈、視覚化が容易です。

結論

デシジョンツリーとランダムフォレストの違いは、デシジョンツリーは分岐方法を使用して決定のすべての可能な結果を​​示すグラフであるのに対し、ランダムフォレストはすべての出力に基づいて最終結果を与えるデシジョンツリーのセットであるということです。その決定木。

リファレンス:

1.ランダムフォレストアルゴリズム–ランダムフォレストの説明|機械学習のランダムフォレスト、Simplilearn、2018年3月12日、こちらから入手できます。

デシジョンツリーとランダムフォレストの違い