Pandas היא ספריית קוד פתוח בפייתון שמאפשרת עבודה נוחה עם נתונים בטבלאות – ממש כמו באקסל, רק עוצמתית וגמישה הרבה יותר. היא מאפשרת קריאה, עיבוד, ניתוח ואחסון של כמויות נתונים גדולות בצורה יעילה. רואי חשבון ואנשי כספים מתמודדים עם טבלאות, דוחות ומאגרי מידע ו-Pandas מספקת את הכלים לשלוט בכל אלו באמצעות מספר שורות קוד.
תאמינו לי, אני חובבת גדולה של אקסלים, אך כשמדובר על אוטומציה, ניתוח כמויות מידע גדולות, או תהליכים שחוזרים על עצמם – Pandas מנצחת. בעזרת מספר שורות קוד ניתן:
לסדר נתונים (להסיר כפילויות או שורות חסרות)
לאחד קבצים ודוחות ממקורות שונים
לבצע חישובים פיננסיים מותאמים אישית
לבנות דוחות חוזרים בצורה אוטומטית
כל פעולה ניתנת לשחזור, תיעוד ואוטומציה מלאה.
Pandas הוא כלי בקוד פתוח, כלומר הוא חינמי לחלוטין – אין צורך ברישיון או בעלויות שימוש, מה שהופך אותו לאידיאלי עבור משרדי רו”ח, פרילנסרים ועסקים קטנים. מעבר לכך, מדובר באחת הספריות הפופולריות ביותר בעולם האנליטיקה, כך שקיימים אלפי מדריכים, סרטונים, פורומים ודוגמאות קוד שנגישים ברשת – גם בעברית. קל מאוד ללמוד את הבסיס, למצוא תשובות לכל שאלה, ולהרחיב את השימוש בספרייה לפי הצורך. בזכות קהילת מפתחים ונתח שוק עצום, Pandas מתעדכן ומתפתח באופן שוטף, ומציע שילוב מנצח בין אוטומציה, גמישות ונגישות.
ניקוי וסידור של קבצי אקסל מורכבים: לקוח שלח קובץ עם מאות שורות – חלקן כפולות, חלקן שגויות. באמצעות drop_duplicates
ו-fillna
מנקים את הכל בשניות.
איחוד דוחות מריבוי קבצים: במקום להעתיק ולהדביק, טוענים את כל הקבצים עם pd.concat
ומשווים את הנתונים בקלות.
ניתוחים חודשיים/רבעוניים: מחשבים הכנסות, הוצאות, ממוצעים וסטיות תקן – הכל בקוד פשוט שחוזר על עצמו כל חודש.
מעקב אחר תשלומים חריגים: פילוח נתונים לפי קטגוריות, זיהוי ערכים קיצוניים.
בעדכון האחרון של Microsoft, נוספה אפשרות מהפכנית: הרצת קוד Python ישירות מתוך Excel – בלי צורך בהתקנות מיוחדות או מעבר בין תוכנות. המשמעות היא שאפשר להשתמש ביכולות החזקות של Python בכלל (ובפרט ספריית Pandas) בתוך הגיליונות עצמם: לבצע ניתוחים מתקדמים, פילוחים, חישובים סטטיסטיים, ואפילו לבנות גרפים מורכבים – והכול בתוך סביבת העבודה המוכרת של Excel.
מדובר בשדרוג משמעותי שמשלב בין הנוחות של אקסל לבין העוצמה של קוד – ומאפשר להפוך גיליונות לכלי ניתוח מקצועי וחכם בהרבה. האפשרות זמינה כיום בגירסאות Excel מסוימות כחלק מהשירותים בענן של Microsoft 365.
הדרך להפעיל את האפשרות ל-Python בתוך האקסל היא פשוט לכתוב =PY
היום קל מתמיד להיכנס לעולם של Pandas גם בלי רקע טכני:
import pandas as pd
# Load the original transactions file
df = pd.read_excel('transactions.xlsx')
df['Date'] = pd.to_datetime(df['Date'])
df['Month'] = df['Date'].dt.to_period('M')
# Calculate monthly income
monthly_income = df[df['Type'] == 'Income'].groupby('Month')['Amount'].sum()
# Print result
print(monthly_income)
קטע הקוד מציג דרך פשוטה אך יעילה להשתמש ב־Pandas לצורך סיכום הכנסות לפי חודשים.
בשלב הראשון אנו טוענים את קובץ העסקאות (transactions.xlsx
) לתוך DataFrame – מבנה הנתונים המרכזי של Pandas. לאחר מכן, אנו ממירים את עמודת התאריכים (Date
) לפורמט תאריכים בעזרת pd.to_datetime
, כדי לאפשר עיבוד תקופתי.
לאחר ההמרה, נוצרה עמודת Month
המייצגת את החודש של כל עסקה – באמצעות הפונקציה dt.to_period('M')
שמבצעת עיגול לתחילת החודש (למשל: כל תאריך באוגוסט 2025 יקבל ערך 2025-08
).
בשלב הבא, מבוצע סינון של השורות בהן סוג העסקה הוא “הכנסה” (‘Type == 'Income
), ולאחר מכן מקבצים את הנתונים לפי החודש (groupby('Month')
) ומסכמים את הסכומים בעמודת Amount
.
התוצאה: טבלת סיכום שמציגה את סך ההכנסות בכל חודש – פתרון מהיר ויעיל שמחליף שימושים מורכבים בטבלאות ציר באקסל.
מצרפת תרשים קצר להעמיק את ההבנה:
רוצים לתרגל אבל לא יודעים מאיפה להביא Data רלוונטי? יש שתי אפשרויות מעולות:
1. אתרים שבהם אפשר למצוא מאגרי מידע חינמיים כמו לדוגמא: Kaggle
2. פשוט תבקשו מהצ’אט שיכין לכם dummy file, הוא מצויין בזה (:
מוזמנים להצטרף לקהילה הייעודית שהקמתי ב-Facebook
שם אפשר ללמוד, להתייעץ וכמובן לשתף – כי קהילה זה כוח אדיר!
Copyright © 2025 Gal Bloch