המונח Web Scraping, או בשמו העברי "שאיבת מידע" , מתייחס למשפחת טכניקות לחילוץ ואיסוף מידע מאתרי אינטרנט. ישנן דרכים שונות לשאוב מידע, החל מאיסוף ידני ועד לתוכנה המבצעת פעולה זו באופן אוטומטי.
כחלק מהסיבות לשאיבת מידע מאתרי אינטרנט ניתן לזהות, לדוגמא, ספאמרים המעוניינים לשאוב כתובות מייל של גולשי האתר לצורך שליחת דואר זבל וכן, צוות מיזם המתכנן לשאוב מידע מעמודי אתרים רלוונטים על מנת לחקור את הרגלי הצרכנים בשוק המיועד.
לשאיבת מידע יש מספר השלכות שליליות העלולות להפוך לעילת תביעה משפטית של ממש. ראשית, שאיבת מידע בעזרת תוכנה אוטומטית עלולה ליצור עומס על האתר, ובמקרים קיצוניים להביא לקריסתו. שנית, מדובר בשימוש בתכנים המתפרסמים באתר; העתקת תמונות, מודעות וכתובות מייל של משתמשים. שאיבת פרטים אלו עלולה להפר את מדיניות הפרטיות ואת תנאי השימוש באתר.
מאמר זה יסקור בקצרה את הגישות המשפטיות ביחס לשאיבת מידע מאתרי אינטרנט בדין הישראלי. הראשונה, מתייחסת לשאיבת מידע כאל "הפרעה שלא כדין לשימוש במחשב" לפי חוק המחשבים. השנייה, מתייחסת לשאיבת מידע כאל "הסגת גבול במיטלטלין" לפי פקודת הנזיקין, והשלישית, מתייחסת לשאיבת מידע כאל הפרה של חוק זכות יוצרים. כמובן שהשימוש באמצעים אוטומטיים לצורך איסוף מידע מעלה גם סוגיה של הפרת פרטיות, הן מבחינת תנאי השימוש של האתר והן מבחינת חוק הגנת הפרטיות.
איסור שאיבת מידע במסמך תנאי השימוש של האתר
כחלק מהמאמץ להתגונן מפני שאיבת מידע, בעלי אתרים רבים אימצו הגנה בדמות הבניית סעיף האוסר על שאיבת מידע במסמך תנאי השימוש של האתר. מסמך זה מהווה חוזה בין בעלי האתר למשתמשים ולהפרתו ישנה משמעות משפטית ניכרת. לדוגמא, תת סעיף 3.2 בסעיף הבטיחות במסמך תנאי השימוש של אתר פייסבוק אוסר, בצורה ברורה, על שאיבת מידע:
"לא תאסוף תוכן או מידע של משתמשים ולא תיגש לפייסבוק בצורה אחרת, באמצעים אוטומטיים (כגון מנועי איסוף, רובוטים, עכבישים או שואבי תכנים) ללא הרשאה מראש מאתנו."
על כן, לפי תנאי השימוש של פייסבוק, איסוף מידע שלא דרך המנגנונים המקובלים שלה, ושנעשה בעזרת אמצעים אוטומטיים, הינו אסור ללא אישור החברה.
הפרעה שלא כדין לשימוש במחשב
הגישה המשפטית הראשונה מוסדרת בחוק המחשבים התשנ"ה – 1995 . לפיו, פעולת שאיבת מידע עשויה להיחשב להפרעה שלא כדין לשימוש במחשב:
"7. מעשה מן המעשים המנויים להלן הוא עוולה על פי פקודת הנזיקין [נוסח חדש], והוראותיה של פקודה זו יחולו עליו –
(1) הפרעה שלא כדין לשימוש במחשב או בחומר מחשב, בכל דרך שהיא, לרבות על ידי גזילת דבר המגלם חומר מחשב;
(2) מחיקת חומר מחשב, גרימת שינוי בו או שיבושו בכל דרך אחרת, שלא כדין."
הרציונל מאחורי תפיסה זו הינו כי השימוש בתוכנה האוטומטית גורם להכבדה על האתר ואף עלול לגרום לקריסתו. לעומת זאת, על מנת להכשיר שאיבת מידע ניתן לטעון שבמידה והשימוש בתוכנה לאיסוף המידע אינו מכביד או פוגע בתפקודו של האתר, לא יגרם נזק ולכן הדבר לא יעלה לכדי שימוש שאינו סביר כנדרש בעוולה.
הסגת גבול במיטלטלין
הסגת גבול במיטלטלין הינה עוולה הקבועה בסעיף 31 לפקודת הנזיקין:
"31. הסגת גבול במיטלטלין היא לקיחת טובין שלא כדין מהחזקתו של אדם אחר, או הפרעה אלימה בהם בהיותם בהחזקתו של אדם אחר; אך אין תובע יכול להיפרע פיצויים על הסגת גבול במיטלטלין אלא אם סבל על ידי כך נזק ממון."
פעולה של איסוף מידע עשויה להיחשב הסגת גבול במיטלטלין – כך לפחות לפי פסק דין סויסה. במקרה זה, התובע, אורי אבן חן, הינו מנהל אתר אינטרנט המספק שירותי היכרויות ומפעיל פורומים. לטענתו, הנתבע, ניר סויסה, הפעיל תוכנה לאיתור תיבות דואר אלקטרוני בפורומים המנוהלים באתר ללא רשותו, דבר שהעמיס על שרתי האתר ואף הביא לקריסתו. בית המשפט קבע כי מדובר בפעולה אגרסיבית החורגת מפעילות רגילה באינטרנט. מכאן, הגיע בית המשפט למסקנה כי הפעולה שהביאה לקריסת השרת מקיימת את כל היסודות של עוולת הסגת גבול במיטלטלין: כוונה, הפרעה אלימה, נזק ממון, וקשר סיבתי. לכן, יכול להיות שאיסוף מידע באמצעים אוטומטיים יעלה לכדי הסגת גבול. אבל, חשוב לציין שבמקרה זה, בערעור לבית המשפט המחוזי, דחה בית המשפט את הטענה שמדובר בהסגת גבול וקבע כי מאחר והמערער שאב מידע ללא תוכנה (בניגוד למה שנטען בתביעה הראשונה), לא נגרם נזק לאתר ולכן לא מתקיימת עוולה זו. לכן, היה ותצליחו להוכיח ששיטת איסוף המידע לא פוגעת באתר, יהיה אפשר לטעון בבית המשפט שלא התקיימו יסודות עבירת הסגת גבול במיטלטלין.
הפרת זכויות יוצרים
בפרשת ג'וב מאסטר, חברת ג'וב מאסטר בע"מ, המפעילה אתר המפרסם משרות פנויות בשוק העבודה בישראל תובעת צו מניעה, שיאסור על אתרALL JOBS , הנתבע, להעתיק מודעות המתפרסמות באתר. וכן, למתן סעד לפיו אתר ALL JOBS הפר את הסכם תנאי השימוש באתר ג'וב מאסטר כאשר העתיק את המודעות. לגבי הפרת תנאי השימוש, בית המשפט קבע כי אין מחלוקת על כך שבכניסה לאתר מתבקש הגולש לאשר כי קרא והסכים לתנאי השימוש, שכן אין אפשרות להמשיך לגלוש באתר מבלי לעשות כך. עם זאת, ביהמ"ש הדגיש כי המידע הכלול במודעות שהועתקו מהווה מידע מסוג "עובדות ונתונים" אשר אינו מוגן מכוח דיני זכות יוצרים. על כן, מכיוון שדיני זכויות יוצרים שוללים הגנה על מידע מסוג זה, לא ניתן להגביל את השימוש במידע המצוי באתר אחר מכוח הסכם תנאי שימוש. לפיכך, נראה שהטלת מגבלה על שימוש במידע השייך לכלל, באמצעות הסכם תנאי שימוש לא תתקבל.
בפרשת מעריב, תבעה מעריב סעד, בהתבסס על עילת הפרת תניות חוזיות המופיעות בעיתון ובאתר NRG, האוסרות על העתקת תכנים. תניות אלו מתבססות על כך שלעיתון ישנה זכות יוצרים במידע. עם זאת, תוכן מודעות הדרושים אינו חוסה תחת הגנת דיני זכות יוצרים משום שגם במקרה זה, כמו בפרשת גו'ב מאסטר, מדובר במידע מסוג "עובדות ונתונים". על כן, התניות החוזיות, שמתייחסות למידע במודעות הדרושים בעיתון ובאתר אינן מחייבות. בית המשפט קבע שמכיוון שאין זכויות יוצרים בתוכן המודעות, תנאי השימוש כשלעצמם לא יוכלו להעניק זכות כזאת. לאור שני פסקי הדין, ניתן לזהות מגמה המצמצמת את הגנת בעלי האתרים שכן המסקנה הנדרשת היא שאם אין על המידע הנשאב הגנת זכויות יוצרים ומדובר במידע ציבורי, נראה שהאתר לא יכול להגביל את השימוש במידע ובתוך כך, לאסור את שאיבת המידע.
סוגיית מדיניות הפרטיות של האתר
בפרשת סויסה שנדונה במאמר, נקבע כי מאחר ומשתמשי הפורום פרסמו את כתובת הדואר האלקטרוני שלהם, היה עליהם לצפות כי הכתובת תהיה חשופה לכל הגולשים באינטרנט היכולים להעתיקה. כמו כן, אתר המציע שירותי פורומים לציבור הרחב, ומעניק למשתמשי האתר את האפשרות לפרסם את כתובת הדואר האלקטרוני שלהם, לא יכול לטעון לבעלות על כתובות אלה. על כן, ניתן לטעון ששאיבת מידע העונה להגדרה "ציבורי" מהווה הוצאת מידע מסחרי גלוי שאינו פוגע באתר.
אז מה כדאי "לשאוב" מהמאמר ?
ניתן לזהות מגמה כללית של צמצום ההגנה על בעלי האתרים לפי גישת הסגת הגבול מאחר וביהמ"ש מתייחס לשאלת הנזק הנגרם כתוצאה משאיבת המידע ולא להסכמה לביצוע השאיבה בלבד. בנוסף, כאשר השאיבה מתבצעת בדרך ידנית, מבלי לפגוע בפרטיות המשתמשים ומבלי לפגוע בדרך כלשהי באתר ממנו אוספים את המידע, סביר שתהיה לבית-המשפט נטייה להתיר אותה. לכן, ככל שהיקף שאיבת המידע על-ידכם יהיה מצומצם יחסית, אז רמת החשיפה המשפטית תהיה קטנה.
לעומת זאת, ניתן לטעון כי יכול שיפסק שביצוע שאיבת מידע בניגוד לתנאי השימוש באתר הינו פעולה אסורה, זאת במיוחד כאשר האיסוף עונה על אחד או יותר מהמאפיינים הבאים: היו תנאי שימוש ונדרשת הסכמה אקטיבית להם, האתר הנשאב נפגע כתוצאה מסריקת המידע וכך גם פרטיות המשתמשים. יתרה מזאת, אם מדובר בחברה עולמית בעלת נציגות משפטית בכל העולם, אשר כבר תבעה בעבר על ביצוע איסוף מידע בניגוד לתנאי השימוש שלה, אז קיים סיכון כי היא תנצל גם מקרים 'קטנים' של איסוף מידע כהזדמנות לתת דוגמא למען ייראו וייראו.
מכאן, המסקנה היא שרצוי לעשות את איסוף המידע בדרך של scraping רק אם אין אלטרנטיבה אחרת, הדבר מהותי עבור הצלחת המיזם שלכם, ובכפוף לאמצעים שהוזכרו. שאלה מנחה להחלטתכם צריכה להיות האם תועלת איסוף המידע, גבוהה מעלות תביעה אפשרית. כמו כן, גם במקרים בהם תנאי השימוש של האתר אוסרים על שאיבת מידע – ניתן לשקול וליצור קשר עם בעל האתר לצורך קבלת אישור לביצוע הפעולה.
אין לראות במידע המוצג כייעוץ משפטי ואין להסתמך עליו ככזה. המידע עשוי להיות לא מעודכן ולהשתנות בכל עת ללא הודעה מראש או בדיעבד.