ML Slips

ML Slips

Best Of Luck 👍

ML Slips FYMCA (Engineering)

Tutorials

🔹 General Steps to Run Programs in Anaconda / Jupyter Notebook

Install Anaconda (from anaconda.com/download).
Open Anaconda Navigator.
Click Launch under Jupyter Notebook.
Your browser will open at http://localhost:8888/tree.
Click New → Python 3 (ipykernel) to create a new notebook.
Write or paste your Python code in a cell.
Press Shift + Enter to execute the cell.
Save your work: File → Save and Checkpoint.

💡 Tip: Always store your datasets (.csv, .xlsx) in the same folder as your notebook for easy access.

🧩 Problem Set 1 – Control Structures & Data Import/Export

Use loops (for/while) and if-else statements for logic building.
Import data with import pandas as pd → pd.read_csv('filename.csv').
Clean and process data (drop missing values, rename columns, etc.).
Export using df.to_csv('output.csv').

🤖 Problem Set 2 – KNN Classification (e.g., Iris Dataset)

Import: from sklearn.neighbors import KNeighborsClassifier.
Load data: from sklearn.datasets import load_iris.
Split dataset using train_test_split.
Fit model: knn.fit(X_train, y_train).
Predict: y_pred = knn.predict(X_test).
Evaluate accuracy using accuracy_score().

🧠 Problem Set 3 – Naïve Bayes Classifier

Import: from sklearn.naive_bayes import GaussianNB.
Prepare features and labels (X, y).
Train the model: model.fit(X_train, y_train).
Predict using model.predict(X_test).
Evaluate using accuracy, precision, recall, and F1-score.

🛒 Problem Set 4 – Apriori Algorithm (Market Basket Analysis)

Install library: pip install mlxtend.
Import: from mlxtend.frequent_patterns import apriori, association_rules.
Load dataset (e.g., Online Retail Dataset).
Convert transactions into 0/1 format using one-hot encoding.
Apply apriori(df, min_support=0.05, use_colnames=True).
Generate rules using association_rules().

📊 Problem Set 5 – K-Means Clustering

Import: from sklearn.cluster import KMeans.
Load a dataset (e.g., Iris, Customer, or Fruit dataset).
Preprocess the data (scaling if needed).
Choose number of clusters (k) using the elbow method.
Apply clustering: kmeans = KMeans(n_clusters=k).
Visualize using matplotlib.pyplot scatter plots.

📈 Problem Set 6 – Model Comparison and Evaluation

Use datasets like Iris, Fruits, or Online Retail.
Compare models: Logistic Regression, SVM, and KNN using accuracy scores.
Visualize results with bar or line charts.

✅ Required Libraries: pandas, numpy, matplotlib, scikit-learn, mlxtend
Install missing ones using:

pip install pandas numpy matplotlib scikit-learn mlxtend

⚠️ Note: Restart the Jupyter kernel if you install a new library during runtime.