機械学習

Python

Pandasで学ぶ機械学習データ前処理入門:欠損値・外れ値・表記ゆれ対策と頻出関数

はじめに:機械学習とデータ前処理の重要な関係こんにちは!これから機械学習、特に「教師あり学習」について学んでいきたいと考えている皆さん。このブログへようこそ!機械学習と聞くと、なんだか難しそうな数式やプログラムがたくさん出てくるイメージがあ...
機械学習の関数

機械学習における「多重共線性の罠」が起きる理由とは?

この記事では機械学習における「多重共線性」について、初心者の方にも分かりやすく解説していきたいと思います。多重共線性とは何か?多重共線性とは、機械学習モデルで使用する特徴量(データの特性を表す値)同士が強く関連している状態のことです。簡単に...
機械学習の基本

機械学習のサンプルデータセット:カリフォルニア住宅価格データセットを読み込む方法

機械学習を行う際に、サンプルデータとしてよく扱われるのが、「カリフォルニア住宅価格データセット」と呼ばれるデータセットです。このデータセットは、カリフォルニアの住宅価格と、その住宅の様々な特徴量(築年数、部屋数、位置情報など)を含むデータで...
機械学習の基本

ラベルエンコーディングとワンホットエンコーディング:機械学習初心者のための完全ガイド

機械学習の世界では、データの前処理が非常に重要です。特にカテゴリデータ(文字列や名称など)を数値に変換する作業は避けて通れません。今回は、そんなカテゴリデータ処理の基本となる「ラベルエンコーディング」と「ワンホットエンコーディング」について...
機械学習の基本

Pythonで始める機械学習入門:東京の気温データを使った線形回帰

この記事では、機械学習の基礎である「線形回帰」について、実際にPythonコードを紹介しながら解説していきます。具体的には、東京の気温データを使って翌日の気温を予測するモデルを作成します。また、Google Colaboratory(通称:...
機械学習の基本

はじめての機械学習:教師あり学習とは? Pythonでサンプルデータを分析

はじめに機械学習という言葉を聞いたことはあるけれど、「実際に何ができるのか?」「どうやって学習するのか?」と疑問に思っている方も多いでしょう。この記事では、機械学習の中でも最も基本的な「教師あり学習」について、プログラミング初心者の方にも分...