נסים נידם
במאמר הקודם התמקדנו בשאלה העקרונית, האם סטטיסטיקה לאתרי אינטרנט, היא תיבת פנדורה? או כלי שיווק ניהולי?
לאחר שענינו על השאלה ברמה העקרונית, ננסה היום להתמודד עם שאלות חשובות בתהליך, שיסייעו לנו לקבל את ההחלטה הנכונה ביותר בהתאם לצרכים השיווקיים והטכנולוגיים של האתר שלנו וכן ליכולות התקציביות שלנו.
איזה כלי ניתוח תנועה מתאים לי?התשובה לשאלה זו מורכבת ותלויה במערכת שיקולים רבים וצרכים שונים של כל אתר, אותם נדגים לאורך השבועות הבאים.
אולם בבסיס ההחלטה נמצאות שתי שיטות שונות לאיסוף הנתונים המוצגות בקיצור בטבלה (קצת טכניות אך יפורטו בהמשך):
שיקול
ניתוח קבצי לוג
ניתוח JavaScript
עלות
חד פעמית, מותנית ברכישת רישיון לתוכנה
חודשית/שנתית, מתומחרת לפי היקף הדפים הנצפים באתר
אבטחת מידע
+ המידע נשמר בידי האתר
- אחריות על אבטחת הנתונים נמצאת בידי נותן שירות הניתוח
רמת דיוק
- בין 97%-98%
+ שואפת ל 99.99%
ניתוח נתונים היסטוריים
+ אפשרי באם הנתונים נאספו לאורך השנים
- לא אפשרי. ניתוח הנתונים מתאפשר רק מיום הטמעת הקוד
תלות בספק השירות
+ מינימאלית, שירות ושדרוגי גרסא
- מלאה, אם יש התקשרות עם הספק יש שרות. אם אין אז אין.
התקנה והטמעה
+ התקנה חד פעמית של תוכנה.
- הכנסת קוד לכל עמוד באתר. יש צורך בחזרה על הפעולה בכל עמוד חדש שנוצר באתר או שילוב קוד מיוחד.
שתי אפשרויות:
בבואנו לבחון את שוק כלי התוכנה לניתוח סטטיסטיקות באינטרנט, נבחין בין שתי שיטות טכנולוגיות שלכל אחת מהן יתרונות וחסרונות:
• ? ניתוח של קבצי לוג- כל אתר שומר פרטים על כל פעולה הנעשית באתר בקובץ מערכת הנקרא לוג (log), על בסיס ניתוח של הנתונים המצטברים בקבצי הלוג ניתן לייצר דוחות מגוונים ברמות שונות אודות הפעילות באתר. את קבצי הלוג לרוב ספקי האחסון אצלם יושב האתר מאחסנים בארכיונים לרוב לתקופות של עד שנה ולעיתים יותר.
• ? ניתוח JavaScript- JavaScript היא שפת תכנות לעולם האינטרנט המאפשרת ביצוע אינטראקציה עם הגולש (לעומת HTML המוכרת יותר אך סטטית). באמצעות קוד ה- JavaScript שמודבק על גבי עמודי האתר, פעולות של הגולש מועברות למערכת הניתוח הסטטיסטי של נותן השירות, ושם נאספות ליצירת דוחות אפקטיביים.
אבטחת מידע
מרבית ספקי שירותי הסטטסטיקה המוכרים בשוק (כגון Omniture, Nielsen Netratings, Webtrends ) פועלים בשיטת ניתוח JavaScript מתוך האתר. שתאפשר להם בעתיד גם לספק שירותים נוספים על בסיס המידע המצטבר (Nielsen הרי זקוקים מקור לנתונים שלהם כדי להוציא סקרים).
מכיוון שבשיטה זו הנתונים נשלחים לאיסוף בצד ג', הם נחשפים לסכנות של דליפה במהלך המעבר ובזמן השהיה במערכת של נותן השירות. באתרים כגון אתרי מסחר ופיננסים, בהם לקוחות משאירים נתונים חסויים כגון מספרי כרטיסי אשראי, ות.ז., לרוב לא אוהבים להשאיר את האחריות על הנתונים לצד ג'.
בניתוח קבצי לוג, הפעילות נעשית באופן מקומי על מחשבי ושרתי החברה וסוגיית האבטחה נתונה בידכם באופן מלא.
דיוק ותחזוקה
שיטת ה- JavaScript מספקת דיוק גבוהה יותר של הנתונים, אולם דורשת משאבי IT להטמעת הקוד בכל עמודי האתר הקיימים וכן בכל העמודים החדשים שיועלו בעתיד. שיטה זו מתאימה לאתרים "קלים" מבחינת היקפי התנועה (Traffic)
מצדו השני של המתרס, הכלים שעדיין מאפשרים ניתוח של קבצי לוג, הם בעיקרם תוכנות בסיסיות, חלקן חינמיות או שעלותן היא עשרות דולרים. נמצא אותם כשירותי ערך מוסף שיציעו לנו ספקי האחסון, כחלק ממערכות ניהול התוכן של האתר או להורדה באלפי וריאציות ברשת, למרות שבקטגוריה זו קיימים גם כלים מתוחכמים ולא זולים , שמתאימים בעיקר לאתרים גדולים המחפשים עומק בתהליכי הניתוח וכריית הנתונים והבנה יותר מופשטת של התהליכים השיווקיים באתר ע"י איתור וסימון קבוצות התנהגות של גולשים על פי קריטריונים ייחודיים.
תלות בספק השירות
בשיטת ניתוח ה JavaScript , התלות בספק השירות היא מוחלטת ואין ביכולתנו לשנות את הגדרות הקונפיגורציה הבסיסיות, לדוגמא: מהו אורך החיים של משתמש ייחודי (unique), מהו אורך הביקור(Session) המקסימאלי/מינימאלי באתר. כמו כן השירות מותנה בתשלום, ברגע שהתקשרות נפסקת אין יכולת לנתח את רצף הנתונים ונתונים היסטוריים בפרט.
בשיטת ניתח קבצי הלוג (log files) התלות בספק השירות היא מינימאלית, ומתרכזת בעיקר בשדרוגי גרסא ותמיכה שוטפת. היות ואנו מנתחים קבצי לוג סטנדרטיים יש לנו גם את היכולת לנתח נתונים היסטוריים ( חשוב בעיקר לאתרים שעוברים שדרוג). כמו כן את קבצי הלוג הסטנדרטים ניתן לנתח בכל כלי המנתח לוגים בעוד שבשיטה השנייה כל ספק יקצה קוד JavaScript ייחודי שלא ניתן לניתוח בכלים אחרים .
העלויות
העלות לניתוח קבצי לוג תסתכם בדר"כ ברכישה חד פעמית של רישיון לתוכנה, בכפוף למספר קבצי הלוג שיש לנתח במקביל( אתרים גדולים הפועלים בסביבה מרובת שרתים) , ועלות שולית לתמיכה שנתית.
לעומת ניתוח באמצעות JavaScript, מתומחר לפי היקף הדפים הנצפים באתר שתלוי באופן ישיר בהיקפי תנועת הגולשים לאתר, היות והספקים הבינו שבדרך זו רווחיהם יגדלו משמעותית.
ישנו מספר מצומצם של כלי ניתוח שיודעים לספק פיתרון משולב לאתרים בינוניים גדולים, הן מבחינת היקפי/מורכבות התנועה ו/או כמות השרתים לניתוח במקביל, והן לאתרים המעוניינים בשליטה מלאה במידע מבלי לשלוח אותו לשרת צד שלישי)בעיות אבטחה, פרטיות וכו'), וכן, חשוב מאוד, לבעלי אתרים אלו שנדרשים לשלם עלויות גבוהות ומשתנות, בגלל היקפי התנועה.
פתרון זה יהיה להקים שרת ייעודי לאיסוף המידע מקוד ה JavaScript באתר (במקום לשלוח את המידע לספק חיצוני) , ולנתח את המידע המצטבר באופן מקומי ( ניתוח קובץ הלוג של השרת) באמצעות כלי ניתוח. לשיטה זו קוראים JavaScript Data Collector - JDC
אז מה היה לנו?
הנחיצות של ניתוח תנועה באתר האינטרנט שלנו ברורה, בין אם אנחנו פורטל החדשות כמו Ynet ובין אם זה הבלוג של מארץ נהדרת. אך כדי למצות את ההשקעה במערכת ניתוח אתרים יש להתאימה מבחינה טכנית לדרישות של האתר ולמאפייניו. לשם כך הצגנו שני מונחים טכניים שחשוב להכיר: JavaScript וקבצי לוג, המהווים את שתי הגישות הבסיסיות להפעלת ניתוח אתרים.
בין לקוחות החברה אל- על נתיבי אוויר לישראל, מפעל הפיס, מכון הייצוא הישראלי, פלאפון תקשורת, המרכז הבינתחומי הרצלייה, איסתא, גוליבר, מלונות אפריקה ישראל (הולידיי אין), משרד התמ"ת, משרד התיירות, קבוצת רד-בינת, הסוכנות היהודית, מג'יק תעשיות תוכנה, ECI, מגל מערכות אבטחה, אורביט טכנולוגיות, Audiocodes, NDS ועוד.