ידידו הטוב ביותר של המתרגם

המרצים המסכנים שלי באוניברסיטה, עדיין יש לי נקיפות מצפון כשאני חושבת עליהם, עם כל העבודות שהגשתי בכתב ידי המזעזע. גם הלילות הארוכים של כתיבת עבודות בעט, תיקונים ומחיקות (כולל שאיפה של אדי טיפקס) לא זכורים לי לטובה. כיום, הודות למחשב, תהליך הכתיבה הוא מהיר ונוח: אין בעיה למחוק, לגזור ולהעתיק מילים וקטעים שלמים, לעצב את הטקסט ועוד. בנוסף ליכולות עיבוד התמלילים, המחשב מספק משאבים יקרי-ערך להפליא למתרגמים, כגון מילונים אלקטרוניים, תרגום מכונה, תוכנות זיהוי קולי, כלי תרגום בסיוע מחשב (CAT Tools), וכמובן מנועי חיפוש כגון Google, שבלעדיהם חיינו אינם חיים.

מוזר לחשוב על הסופרים או המתרגמים בעבר הרחוק יותר, שנאלצו לכתוב עמודים על עמודים בקולמוס. המצאת העיפרון במאה ה-17 אפשרה למחוק טעויות בטקסט בקלות יחסית, אך מכונת הכתיבה, שנכנסה לשוק בצורתה הנוכחית  במאה ה-19, הייתה מהירה ויעילה בהרבה, אף שגם לה היו מגבלות רבות.

מחשבים אישיים נמצאים בשימוש כבר מתחילת שנות ה-80 של המאה שעברה, אולם רק בשנות ה-90 התווסף אליהם האינטרנט לשימוש ביתי – שחולל מהפכה בכל העולם. האינטרנט איפשר לראשונה לאנשים ברחבי העולם לתקשר זה עם זה בזמן אמת ולגשת למאגרי מידע עצומים הנמצאים בשרתים של מחשבים המפוזרים בעולם כולו.  יש מתרגמים החוששים מהתקדמות הטכנולוגיה, וחושבים שבעתיד הלא רחוק יחליפו תוכנות של תרגום מכונה את המתרגמים בשר ודם. אולם כפי שמכונות לא החליפו את בני האדם בשאר המקצועות, כך אין תחליף גם למתרגם האנושי.

המחשב הוא כלי עזר חשוב למלאכת התרגום, שמקל ומשפר את העבודה. הוא מאפשר למתרגמים לעשות עבודה יעילה, רווחית ואיכותית יותר, הודות לכלים ומשאבים שונים, כגון:

1. מילונים אלקטרוניים (למשל, ‘מילונית אוקספורד’) ומילונים מקוונים החליפו כמעט לחלוטין את המילונים המודפסים. יתרונותיהם עצומים: במילונים מודפסים לוקח זמן רב למצוא את המונח הרצוי, הם לא מתעדכנים באופן שוטף, וכמובן הם גוזלים מקום פיזי רב; ואילו הפורמט האלקטרוני מנגיש לנו את מכלול הידע של האנושות בלחיצת כפתור, מבלי לגזול אפילו סנטימטר.

2. כלי תרגום – Cat Tools – מקצרים ומשפרים את עבודת המתרגמים, מה שמניב רווח גבוה יותר למתרגמים עצמם וכן ללקוחותיהם. בכלי התרגום יש זיכרון תרגום – Translation Memory, או בקיצור TM, וגם מאגר מונחים, גלוסרי – Term Base, או בקיצור TB. את ה-TB יכול המתרגם ליצור בעצמו ולהזין לתוכו מונחים, או לייבא מונחים שהעביר לו הלקוח.

תוכנת התרגום מחלקת את מסמך המקור, הכתוב בשפת המקור, למקטעים. מקטע יכול להיות כל חלק של טקסט, כמו ביטוי או אפילו מילה בודדת, אבל בדרך כלל זהו משפט עם נקודה בסוף. כל מקטע כזה צריך להתאים למקטע בשפת היעד. אם לא נמצאת התאמה קודמת ב-TM, המתרגם ממלא את המקטע עם התרגום. לאחר הזנת התרגום נוצרת יחידת תרגום שמכילה את מקטע המקור ומקטע היעד, יחד עם פרטים נוספים שונים, כגון תאריך היצירה, שם המתרגם וכו’. יחידה זו נוספת לזיכרון התרגום.

בכל פעם שפותחים מקטע חדש לתרגום, התוכנה סורקת את הזיכרון. אם הוא תורגם במלואו בעבר – ה-TM מראה אותו כהתאמה של 100%. אם הוא רק דומה, ה-TM יציג תוצאת fuzzy  במקטע היעד. יש דרגות שונות של דמיון בין התרגום הנוכחי לתרגומים קודמים, שאותן מודדים באחוזים. מובן שהמתרגם צריך לעבור על מקטעים אלה, וביתר קפידה ככל שרמת ההתאמה נמוכה יותר.

כלי התרגום מקצרים את זמן העבודה של המתרגם משתי סיבות: א) הוא אינו צריך לחפש את התרגום של מונח מסוים שוב ושוב, במקרה שאינו זוכר אותו. ב) המילים או המונחים מתאכלסים בקובץ באופן אוטומטי, אם כך מוגדר.

כמו כן, כלי התרגום מסייע לשמור על אחידות סגנונית – המתרגם רואה כיצד ניסח משפט מסוים קודם לכן, וממשיך באותו הקו.

כלי התרגום מציעים גם בדיקת איות ודקדוק, וכן מזהים חזרות – ובכך מונעים תרגום של אותו המשפט בצורה שונה. הכלים הפופולריים ביותר הם Trados‏ ו-MemoQ‏.

3. תרגום מכונה – שימוש באלגוריתמים כדי לתרגם באופן אוטומטי מילים או משפטים לשפה אחרת. יש תוכנות מסחריות שונות ויש גם תוכנות חינמיות, כגון Google Translate. עד כה, אף תוכנה לא מצליחה לתרגם מסמכים מורכבים הכוללים סלנג או שפה מופשטת, או לזהות ולתרגם נכונה מילים רבות-משמעות לפי ההקשר שלהן. תוכנות אלה מתקשות גם עם מבנים דקדוקיים ותחביריים מורכבים, ולכן מתאימות בעיקר לטקסטים טכניים בעיקרם. בסיום תרגום המכונה יש צורך בדרך כלל שהמתרגם יבצע post-editing, שכן התוצאה המתקבלת היא באיכות נמוכה למדי.

4. תוכנות זיהוי קולי –  מסוגלות לפענח דיבור אנושי. הקלט למערכת מגיע ממיקרופון שאליו מדבר המשתמש. תוכנות אלה מקצרות את זמן התרגום ומצמצמות את הצורך בהקלדה ממושכת, ובכך מסייעות במניעת פגיעה בשורש כף היד ובישיבה של שעות על גבי שעות.

5. OCR – זיהוי תווים אופטי – ממיר קובצי תמונה לקובצי טקסט באמצעות זיהוי אופטי של תווים אלפביתיים. הדבא שימושי מאוד כשמקבלים קובץ שהוא תמונה דיגיטלית של דף בעיתון, לדוגמה, ורוצים להעבירו לכלי תרגום. תוכנת ה-OCR סורקת את קובץ התמונה (שיכול להיות למשל בפורמט JPG,‏ BMP או PDF), מזהה את התווים, המילים והמשפטים, ומעתיקה אותם לקובץ טקסט.

ניתן לומר, אם כך, שהמחשב אינו יכול להחליף את המתרגם האנושי, אלא לסייע לו בלבד – ולכן הוא למעשה ידידו הטוב, ולא מתחרה שלו. המחשב הביתי שינה לחלוטין תוך עשרות שנים בודדות את עולמם של בני האדם בכלל, ושל מתרגמים בפרט. האם בעוד 40 שנה לא יאמינו בני הדור הבא כמה מוגבלים היו האמצעים שברשותנו?