העתונות הפתוחה

מתוך הסדנא לידע ציבורי
קפיצה אל: ניווט, חיפוש

מה אנחנו עושים כאן?

הגרעין הירושלמי בפעולה!

מכירים את אתר העיתונות ההיסטורית של הספרייה הלאומית ? אם לא - הנה קישור אליו. יש גם ממשק ישן, שזמין בכתובת הזו.

מה שאנחנו מתכוונים לעשות הוא להשתמש בכתבות ובעיתונים ההיסטוריים כדי ליצור שימושים מגניבים בידע העשיר הזה, בעיקר כדי לאפשר חיפוש ואינדוקס חיצוניים של המידע וגילוי שלו על ידי רובוטים של מנועי חיפוש, שיפור הטקסט שזמין לאיחזור ואולי גם כמה שיפורי ממשק נחמדים לעומת מה שקיים היום באתר הספרייה הלאומית.


מסמך אפיון

למתעניינים - מסמך האפיון נגיש כאן [בקישור הזה https://docs.google.com/document/d/1APkcWwKfLp_dYfo0VLwcInxIPGN17DsqwpnpY-neHsA/edit]

מסמכיאדה

[לינק למסמכולוגיה שלנו: https://readthedocs.org/projects/open-news/]

הגיט שלנו

[הנה הגיט שלנו :-) https://github.com/hasadna/OpenPress]

שימושים מגניבים

הנה כמה כאלה:

  • יצירת ממשקים לדליית מידע עבור חוקרי בלשנות חישובית למשל באמצעות חבילת [1]
  • שיפור איכות הטקסט שנוצר באמצעות תהליכי OCR עk hsh הספרייה, אולי באמצעות מיקור המונים.
  • בניית אפליקציית מובייל לחיפוש במאגר העיתונות
  • בניית כלי "היום לפני X שנים", שמציף כתבה אקראית מהיום לפני...
  • כלי תיוג כתבות שיאפשר לאנשים להוסיף תגיות נושא לכתבות
  • יישום מנגנון re-captcha בעברית, שיתבסס על הטקסט המלא של העיתונים ויאפשר לשפר אותו בטווח הארוך

ועוד ...

רוצים להצטרף?

בואו לפגישות של הקהילה הירושלמית של הסדנא, בימי רביעי החל משעה 19:00 באולם הולצמן של הספריה הלאומית, קמפוס גבעת רם.