دليل شامل لتعلم تحليل البيانات باستخدام Python من الصفر. تعرف على مكتبات Pandas وNumPy وMatplotlib مع أمثلة عملية ومشاريع تطبيقية.
🐍 لماذا Python لتحليل البيانات؟
مقدمة في تحليل البيانات
تحليل البيانات هو عملية فحص وتنظيف وتحويل البيانات لاستخراج معلومات مفيدة واتخاذ قرارات مدروسة.
تجهيز بيئة العمل
🐍 Anaconda (موصى به)
# حمّل من الموقع الرسمي
https://www.anaconda.com/download
# التثبيت اليدوي
pip install pandas numpy matplotlib seaborn jupyter
# تشغيل Jupyter
jupyter notebook
المكتبات الأساسية
| المكتبة | الاستخدام | الاستيراد |
|---|---|---|
| 🐼 Pandas | التعامل مع البيانات الجدولية | import pandas as pd |
| 🔢 NumPy | الحسابات الرقمية والمصفوفات | import numpy as np |
| 📊 Matplotlib | الرسوم البيانية الأساسية | import matplotlib.pyplot as plt |
| 🎨 Seaborn | التصور الإحصائي الجميل | import seaborn as sns |
| 🤖 Scikit-learn | التعلم الآلي | from sklearn import ... |
Pandas: التعامل مع البيانات
📥 قراءة البيانات
# قراءة CSV
df = pd.read_csv('sales_data.csv')
# قراءة Excel
df = pd.read_excel('report.xlsx')
# استكشاف البيانات
df.head()
df.info()
df.describe()
🔧 معالجة البيانات
# التصفية
df[df['price'] > 100]
# التجميع
df.groupby('category')['sales'].sum()
# عمود جديد
df['total'] = df['price'] * df['quantity']
🧹 التنظيف
# القيم المفقودة
df.isnull().sum()
df.fillna(0)
df.dropna()
# إزالة التكرار
df.drop_duplicates()
التصور البياني
import matplotlib.pyplot as plt
# Line Chart
plt.plot(months, sales, marker='o')
plt.title('المبيعات الشهرية')
plt.show()
# Bar Chart
plt.bar(categories, values)
# Pie Chart
plt.pie(sizes, labels=labels, autopct='%1.1f%%')
# حفظ
plt.savefig('chart.png', dpi=300)
مشروع تطبيقي: تحليل المبيعات
# 1. تحميل البيانات
df = pd.read_csv('sales_data.csv')
# 2. التحليل
total_revenue = df['revenue'].sum()
top_category = df.groupby('category')['revenue'].sum().idxmax()
monthly_trend = df.groupby('month')['revenue'].sum()
# 3. التصور
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
monthly_trend.plot(ax=axes[0,0], title='الإيرادات الشهرية')
df.groupby('category')['revenue'].sum().plot(kind='bar', ax=axes[0,1])
# 4. التقرير
print(f"إجمالي الإيرادات: ${total_revenue:,.2f}")
print(f"أفضل فئة: {top_category}")
المسار الوظيفي
| المستوى | المسمى | الراتب السنوي |
|---|---|---|
| مبتدئ | Data Analyst | $60-80K |
| متوسط | Data Scientist | $90-130K |
| متقدم | ML Engineer | $120-180K |
| قيادي | Head of Data | $180-300K |
الأسئلة الشائعة
❓ هل Python مناسبة للمبتدئين؟
نعم، Python من أفضل اللغات للمبتدئين بصياغتها البسيطة ومجتمعها الضخم.
❓ ما أهم مكتبات Python؟
Pandas للبيانات، NumPy للحسابات، Matplotlib للتصور، Scikit-learn للتعلم الآلي.
❓ كم الوقت للإتقان؟
الأساسيات 1-2 شهر، المتوسط 3-6 أشهر، الاحتراف 6-12 شهر.
❓ هل أحتاج رياضيات؟
للمبتدئين تكفي الرياضيات الأساسية. للمتقدم تحتاج الإحصاء والجبر الخطي.
❓ الفرق بين Analyst و Scientist؟
Analyst يستخرج الرؤى من البيانات. Scientist يبني نماذج تنبؤية بالتعلم الآلي.