· Our Corpus
ENלביתמי אנחנואיך זה עובדeval
Corpus · המאגר

מה יש לנו במאגר?

שקיפות מלאה. אנחנו לא מסתירים מה אנחנו מכירים — אנחנו מציגים בדיוק. כל ציטוט שתראה בתשובה, מקורו במאגר הזה.

2.6GB
פסיקה גולמית — JSONL
0
קריאות LLM חיצוני — אפס
100%
ציטוטים verbatim — מאומת
4
תחומי בטא נתמכים
01 · Case Law

פסיקה ישראלית

פסקי דין מ-3 ערכאות — מקור מרכזי לכל תשובה

הליבה של המאגר. כל פסק דין נסרק במלואו, מסומך לפרטי התיק (שם, מספר, ערכאה, שופט, שנה), ונשבר לקטעים. כשאתה שואל שאלה — המערכת מאחזרת את הקטע הרלוונטי ביותר ומחזירה אותו מילה במילה.

ערכאות במאגר

  • בית המשפט העליון — פסקי דין חוקתיים ופירוש חוקים
  • בית הדין הארצי לעבודה — דיני עבודה, יחסי עובד-מעביד, פיטורין
  • בית המשפט המחוזי — סכסוכי שכירות, חוזים, מקרקעין
  • בית משפט השלום — תביעות קטנות, צרכנות, נזיקין קטן

אסטרטגיית עדכון

המאגר נסקר מחדש אחת לרבעון לתוספות חדשות. פסקי דין חדשים נכנסים תוך 4-12 שבועות מפרסומם — לאחר שהם הופכים לזמינים במאגרים הציבוריים.

02 · Statutes

חוקי המגן הישראליים

חוקים, תקנות, צווי הרחבה — הטקסט המחייב

כל החוקים שאתה מוצא ב-/israeli-laws/ נמצאים במאגר במלואם. סעיף-סעיף, עם תיקונים. כשהמערכת מצטטת "סע׳ 17 לחוק הגנת השכר" — היא מחזירה את הטקסט המלא של הסעיף, לא תרגום או פרשנות.

סוגי טקסטים חקיקתיים

  • חוקים ראשיים — ~150 חוקים מרכזיים (הגנת השכר, הגנת הצרכן, חוזים, פיצויי פיטורים וכו׳)
  • תקנות — תקנות הגנת הצרכן (ביטול עסקה), תקנות הסיוע המשפטי, וכו׳
  • צווי הרחבה — בעיקר בדיני עבודה (דמי הבראה, פנסיה חובה)
  • חוקי יסוד — כבוד האדם, חופש העיסוק, הכנסת, השפיטה
03 · Knowledge Base

מקורות משפטיים שניוניים

תוכן הסברתי שאנחנו בנינו בעצמנו — לקונטקסט בלבד

מעבר לפסיקה וחקיקה, יש לנו תוכן הסברתי שיצרנו: מילון מונחים, דוקטרינות, מבני מסמכים, מחשבונים. זה לא חלק מהציטוט verbatim — זה contextual knowledge שעוזר למערכת להבין שאלות בעברית פשוטה ולמפות אותן לסעיפי חוק רלוונטיים.

תוכן שניוני שלנו

השיטה — איך זה עובד

✓ Verbatim Retrieval

כל ציטוט שתראה הוא טקסט אמיתי ממקור במאגר. אפשר ללחוץ על כל ציטוט ולפתוח את פסק הדין המלא או את החוק. אם המערכת לא מצאה ציטוט רלוונטי — היא אומרת זאת בכנות, ולא ממציאה.

✗ Zero LLM Generation

אנחנו לא משתמשים ב-OpenAI, Anthropic, Google, או כל מודל שפה גדול שאחר לייצור תשובות. אפס. אף פעם. החיפוש מבוסס על embeddings + BM25 hybrid retrieval — לא generation. אי אפשר להזות מקור שאינו קיים אם לא יוצרים שום טקסט חדש.

✓ אימות מקור בקליק

לכל ציטוט יש קישור ישיר למקור — מספר תיק, שופט, שנה. אפשר תמיד לבדוק שהציטוט אמיתי, גם אם אתה לא סומך עלינו. שקיפות זה לא טאגליין, זה ארכיטקטורה.

✗ אין "AI שכותב"

שאלות שלא מצאנו להן תשובה ישירה מקבלות הודעה ברורה: "לא נמצאה התאמה ברורה". המערכת לא תמציא פסיקה שתישמע סבירה. זה היתרון של verbatim retrieval על LLM generation: כשהמערכת לא יודעת — היא לא מנחשת.

Live · עודכן בזמן אמת

תמונת מצב — עכשיו

ימים פעילים
שאלות שנענו
עו"ד מאומתים
תחומי משפט
נטען מ-/v1/public/stats...
04 · Quality

איך אנחנו מודדים איכות

eval ציבורי, פתוח לכולם

כל שבוע אנחנו מריצים eval ציבורי — סט של ~50 שאלות משפטיות קנוניות בעברית, נבדק שהמערכת מחזירה תשובות נכונות עם ציטוטים אמיתיים. תוצאות נקודה-פאס/פייל מתפרסמות פומבית.

זה הניגוד הגמור ל"AI שמתפאר בעצמו". אנחנו מודדים, מפרסמים, ו-משתפרים. אפשר לראות את התוצאות העדכניות ב-/eval.

סוגי בדיקה

  • PASS — ציטוט מדויק + הקשר נכון + רלוונטיות לשאלה
  • WEAK — ציטוט נכון אבל ניסוח לא חד
  • FAIL — ציטוט שגוי, מקור לא נכון, או הזיה

היעד שלנו: ≥85% PASS לפני כל release לפרודקשן.

ראית מה יש לנו. עכשיו שאל.

השיטה verbatim מובטחת. אם המערכת לא יודעת — היא תאמר. אם היא יודעת — היא תצטט מילה במילה.

שאל שאלה ←

איך לעבוד עם המאגר

להבין את המקור זה השלב הראשון. אלה הכלים לחילוץ ערך אמיתי.

שאל ב-legal-eye
§ v3 · explore

כל הקורפוס, ויזואלי