ביוני 2023, בית-המשפט הפדרלי במנהטן הורה לעורכי-דין Steven Schwartz ו-Peter LoDuca
לשלם $5,000 כל אחד ולהופיע אישית בפני השופט. הסיבה: הם הגישו תזכיר במסגרת
תיק Mata v. Avianca, Inc. שכלל ציטוטים מ-שישה פסקי-דין שלא קיימים.
את הציטוטים הזין להם ChatGPT.
ה-ChatGPT לא אמר להם "אני לא בטוח". הוא לא אמר "אינני יודע". הוא המציא את Varghese v. China Southern Airlines, את Shaboon v. EgyptAir, את כל היתר — שמות צדדים, מספרי תיקים, ציטוטי-פסיקה. הכל נשמע סביר. הכל היה בדוי.
ההצדקה של Schwartz בשימוע הייתה הקפאת-דם: "חשבתי שזה כמו חיפוש משופר. לא ידעתי שהוא ממציא." השופט Castel לא קיבל. ב-2024-2025 דווח על מקרים דומים בעוד שש מדינות בארה"ב, ובארץ מתחילים להופיע מקרים מקבילים שעדיין לא הוכרעו אבל הם בדרך.
⚠ הכלל הראשון של AI במשפט:
הסיכון הוא לא שה-AI יטעה — סיכון של טעות אפשר לקבל. הסיכון הוא ש-AI ימציא בביטחון בלי לסמן את ההמצאה. עורך-דין שלא הבחין בין השניים מסתבך.
המאמר הזה לא ינסה לשכנע אותך להפסיק להשתמש ב-AI. הוא יציע 5 כללי-אצבע מעשיים שמשתמשים אצל עורכי-דין שכבר משלבים AI בעבודה היומיומית בלי לפתח פוסט-טראומה מ-Nevo.
01. אמת כל ציטוט. תמיד. בלי יוצא מן הכלל.
הכלל הכי בסיסי, והכי מופר. לפני שאתה מגיש מסמך שמכיל ציטוט שיצא מ-AI — פתח את Nevo, חפש את התיק, וודא שהוא קיים. אם הציטוט מצוטט תוך-תיק, וודא שהוא קיים בתוך התיק ולא רק כתיק עצמאי.
זה לוקח 30 שניות לציטוט. סנקציה לוקחת שנה לסיים, ועולה לפעמים גם את הרישיון. היחס הוא לא הוגן.
איך לאמת בפועל:
- חיפוש ישיר ב-Nevo — הקלד את מספר התיק (לא רק את שם הצדדים)
- חיפוש מצטלב — חפש את שם הצד התובע ב-Google site:nevo.co.il, וודא שמופיע גם שם הנתבע
- בדוק את הציטוט המקורי — פתח את פסק-הדין, ודא שהציטוט שצוטט באמת כתוב שם, מילה במילה, באותו הקשר
- אם השתמשת ב-LLM שמייצר תקצירים — אמת גם את הfacts של התקציר, לא רק את הציטוט
02. הבן את ההבדל בין "AI שמייצר" ל"AI שמחפש"
הסיווג שיציל אותך מסנקציה. כל כלי AI משפטי נופל לאחת משלוש קטגוריות:
קטגוריה 1: LLM גנרי (ChatGPT, Claude, Gemini, Llama)
המודלים האלו לא יודעים אם פסק-דין קיים. הם רק יודעים איך תיראה תשובה סבירה. הם הוכשרו על מיליארדי טוקנים של טקסט, וכשאתה שואל שאלה משפטית הם מייצרים טקסט שדומה לטקסט משפטי שראו. אין שום מנגנון פנימי שמונע ייצור של תיק בדוי.
קטגוריה 2: RAG (Retrieval-Augmented Generation)
קטגוריה משופרת. ה-AI קודם מחפש במאגר אמיתי, ואז משתמש בתוצאות החיפוש כדי לייצר תשובה. הסיכון: ה-step של ה-generation עדיין יכול להזיז דברים, לסכם בצורה לא-מדויקת, ולצרף ציטוטים מתיקים שונים זה אחר זה.
קטגוריה 3: Verbatim-only (לדוגמה: Legal Eye)
הקטגוריה הבטוחה ביותר. המערכת מחפשת במאגר, מוצאת תקדים, ומציגה את הציטוט מילה במילה מהמקור. אין שלב generation. אם המערכת לא מוצאת תקדים בטוח — היא שותקת, לא ממציאה.
🔎 הכלל הפרקטי:
ככל שה-AI פחות גנרטיבי, כן הסיכון לסנקציה נמוך יותר. עבור מסמכים שהולכים לבית-משפט, השתמש בכלי verbatim-only או בכלי RAG עם פלט מוגדר. שמור ChatGPT לדברים אחרים — סיעור-מוחין, ניסוח לא-משפטי, summary של מסמכים שאתה כבר קרא.
03. בחר כלי AI שמפרסם eval ציבורי
איך אתה יודע שכלי AI אכן מקיים מה שהוא מבטיח? הוא חייב להציג את הציון שלו לבדיקה ציבורית. בלי זה, אתה סומך על שיווק.
מה זה "eval"? סדרת שאלות-בדיקה קנוניות שמופעלות מול הכלי באופן עקבי, והתוצאות מתפרסמות. ל-Legal Eye, ה-eval הוא קוד פייתון פתוח שרץ אוטומטית כל יום ראשון ב-03:00 UTC מול ה-API הציבורי, ומדווח על כל אחת מ-50 שאלות. אם הציון יורד — רואים את זה באותו יום.
הציון העדכני (13 במאי 2026):
- 0% הזיות — אף ציטוט לא הומצא
- 100% דחיית out-of-scope — 5 מתוך 5 שאלות-פיתוי (מתכון לעוגה, חוקי טראפיק זרים) סורבו בנימוס
- 34% verbatim PASS — 17 מתוך 50 שאלות קיבלו ציטוט verbatim ברמת ביטחון גבוהה
- 0 FAIL — אף לא ציטוט שגוי בנושא
תוכל לראות את הציון המלא ב-/eval. הקוד עצמו פתוח ב-MIT license ב-github.com/GreenCycle2025/legal-eye-eval.
כלי AI שלא מוכן להציג ציון? אל תסמוך עליו. השאלה "מהו ה-hallucination rate שלכם?" צריכה לקבל מספר. אם התשובה היא "אנחנו לא מודדים" או "זה לא הוגן למדוד" — זו תשובה.
04. חפש confidence-score בפלט — והתייחס לו
כלי AI טוב אומר לך כשהוא לא בטוח. כלי AI גרוע לעולם לא אומר "אינני יודע".
ב-Legal Eye, כל תשובה נושאת cluster_score (ערך בין 0 ל-2) ו-coverage
(אחוז). אם ה-score מתחת ל-0.5 או ה-coverage מתחת ל-15%, המערכת אינה מקדמת ציטוט
verbatim. במקום זאת היא אומרת "אינני בטוח, הנה הצעות חיפוש ידני". זה מה
שאתה רוצה.
השוואה:
תמיד נותן תשובה. אף פעם לא אומר "לא יודע". ערך הfile-up מובנה — תוכל לבקש "תן לי תשובה בטוחה יותר" וה-AI ייתן תשובה שונה, גם בטוחה, גם אולי מומצאת.
אם cluster_score=0.26, מציג: "המערכת לא קידמה ציטוט. הצעות חיפוש: 1) חוק פיצויי פיטורים סעיפים 1-3; 2) חיפוש ידני ב-Nevo...". אין נסיון לכפר על אי-הוודאות.
05. בנה תהליך — אל תסמוך על הכלי בלבד
גם הכלי הטוב ביותר טועה לפעמים. הכלל האחרון הוא: AI הוא draft generator, עורך-דין הוא final reviewer. ה-AI מקצר לך זמן, אבל לא מוציא ממך את האחריות.
תהליך מומלץ לכתב טענות שמכיל ציטוטים מ-AI:
— תהליך מאומץ ב-Legal Eye Pro tier, אבל ישים לכל כלי AI משפטי
- הקלד את השאלה / טענה לכלי AI
- אסוף את הציטוטים שהוצעו + מטא-דאטה (שם תיק, מספר, שנה)
- אמת כל ציטוט ב-Nevo — כפי שכלל #1 דורש
- בדוק את ההקשר — האם הציטוט אומר את מה שה-AI ייחס לו?
- השלם את ה-anchor — מהם הelements של ההלכה? איך התקדים הזה משתלב בנושא שלך?
- תעד את התהליך — שמור log של כל ציטוט שאמת, מתי, ובאיזה כלי. אם תופנה לוועדה, התיעוד יציל אותך.
העובדה שאתה משתמש ב-AI לא מהווה הגנה אם הציטוט שגוי. בית-המשפט יבחן אותך כמו כל מסמך אחר שהגשת. תהליך מובנה הוא ההגנה האמיתית.
סיכום — ה-AI כאן להישאר. השאלה היא איך משתמשים.
Mata v. Avianca הוא לא סוף-העולם של AI במשפט. הוא סוף-העולם של AI בלי תהליך. עורכי-דין שכבר עובדים עם הכלים בצורה אחראית רואים ערך אמיתי — שעות-עבודה שמשתחררות, איתורי-תקדים מהירים, drafting מהיר יותר. הם פשוט לא מוצאים את עצמם מסבירים לשופט למה ע"א 1234/22 לא קיים.
Legal Eye בנוי עם 5 הכללים האלו בלב הארכיטקטורה: verbatim-only, public eval, cluster confidence נראה, demur כשלא בטוח, ותהליך מובנה. אבל הכלים האלו אינם התנאי היחיד — אתה התנאי. בכל יום, בכל מסמך, בכל ציטוט.
תאמת. תבדוק. תתעד. ושב בשקט בלילה.