كيف يفكر الذكاء الاصطناعي (وإن لم يفكر)
النظر إلى داخل عقل الذكاء الاصطناعي: استكشاف "بيولوجيا" نموذج لغوي كبير
https://transformer-circuits.pub/2025/attribution-graphs/biology.html
هل تساءلت يومًا عما يحدث داخل الشبكات العصبية المعقدة التي تُشغّل نماذج لغوية كبيرة (LLMs) مثل هايكو كلود 3.5؟ غالبًا ما يبدو الأمر أشبه بصندوق أسود، حيث تُغذّى بالنص وتحصل على مخرجات متماسكة بشكل مدهش (وأحيانًا غريبة بشكل مدهش). ولكن ما هي "الأفكار" الحقيقية التي تدور بينهما؟
يتعمق بحث جديد ومثير للاهتمام في هذا السؤال تحديدًا، حيث يُعامل نماذج الذكاء الاصطناعي المتقدمة هذه تقريبًا ككائنات حية يُمكننا فحصها ودراستها. الأداة الرئيسية في هذا البحث؟ ما يُسمى "رسومات الإسناد".
تخيل رسوم الإسناد كطريقة لتتبع المسارات المعقدة التي يسلكها نموذج لغوي كبير عند تحويل مُحفّز الإدخال إلى استجابة. بدلًا من مجرد رؤية الإجابة النهائية، نُلقي نظرة على بعض الخطوات الوسيطة التي يبدو أن النموذج يتخذها "في عقله". تُولّد هذه الرسوم البيانية فرضيات حول الآليات التي تعمل داخل النموذج.
يستخدم الباحثون القائمون على هذا العمل رسوم الإسناد البيانية هذه لدراسة مجموعة واسعة من الظواهر المثيرة للاهتمام في نموذج الإنتاج البسيط "كلود 3.5 هايكو" من أنثروبيك. إليكم بعض الأمثلة المثيرة للاهتمام لما اكتشفوه:
الاستدلال متعدد الخطوات: أشبه بعملية تفكير مصغرة
تخيل أنك تسأل النموذج عن "عاصمة الولاية التي تضم دالاس". بدلاً من اختيار "أوستن" مباشرةً، تشير رسوم الإسناد البيانية إلى أن النموذج قد يُجري عملية تفكير "ثنائية القفزات" داخليًا. بل يمكنهم رؤية ومعالجة خطوة وسيطة حيث يُمثل النموذج "تكساس" قبل الوصول إلى الإجابة النهائية. الأمر أشبه بمشاهدة نسخة مبسطة من عملية تفكير بشرية تتكشف!
التخطيط في القصائد: استشراف في توليد اللغة؟
هذا رائع للغاية. عندما يُنتج النموذج أبياتًا شعرية، يبدو وكأنه يُجري بعض التخطيط المسبق! تشير رسوم الإسناد البيانية إلى أنه *قبل* كتابة كل سطر، يُحدد النموذج الكلمات المُتناغمة المُحتملة التي قد تأتي في النهاية. ويبدو أن هذه القوافي المُختارة مُسبقًا تُؤثر على كيفية بناء السطر بأكمله. يبدو الأمر كما لو أن النموذج يتمتع بقدر من التبصر، مُراعيًا الهدف النهائي حتى عند بدء الكتابة.
الدوائر متعددة اللغات: لغة فكر عالمية؟
تُلقي الدراسة الضوء أيضًا على كيفية تعامل هذه النماذج مع لغات متعددة. وقد وجدت أدلة على أن النموذج يستخدم مزيجًا من الدوائر الخاصة باللغة ودوائر أكثر تجريدًا واستقلالية عن اللغة. ومن المثير للاهتمام أن هايكو كلود 3.5 الأكثر كفاءة يبدو أنه يعتمد بشكل أكبر على هذه الدوائر المستقلة عن اللغة مُقارنةً بالنماذج الأصغر. وهذا يُشير إلى تمثيل أساسي أكثر شمولية للغة.
الجمع عبر السياقات: تعميم العمليات الأساسية
حتى العمليات التي تبدو بسيطة، مثل الجمع، يبدو أنها تُدار بواسطة دوائر يُمكنها التعميم عبر سياقات مُختلفة تمامًا داخل النموذج. يشير هذا إلى أن النموذج لا يحفظ مسائل جمع محددة فحسب، بل تعلّم آليةً أساسيةً أكثر جوهرية.
التشخيصات الطبية: سيناريوهات "ماذا لو" الداخلية
في مثالٍ شيّقٍ يتعلق بالمنطق الطبي، يُظهر الباحثون كيف يُمكن للنموذج تحديد التشخيصات المُحتملة بناءً على الأعراض المُبلّغ عنها. والأكثر إثارةً للاهتمام، يبدو أنه يستخدم هذه التشخيصات المُرشّحة لتوجيه أسئلة المتابعة التي قد يطرحها حول الأعراض الإضافية - كل ذلك دون تدوين هذه الخطوات الوسيطة صراحةً. يبدو الأمر كما لو أن النموذج يُجري تجارب على سيناريوهات "ماذا لو" الداخلية لتضييق نطاق الاحتمالات.
ماذا يعني هذا؟
يُقدّم هذا العمل، الذي يستخدم الرسوم البيانية الإسنادية، منظورًا جديدًا فعّالًا لفهم الآليات الداخلية لنماذج اللغات الكبيرة. من خلال تجاوز الصندوق الأسود وإلقاء نظرة خاطفة على هذه "الرسوم البيانية الحسابية" الداخلية، يُمكننا البدء في كشف الآليات المُعقدة التي تُمكّن هذه النماذج من تحقيق هذه الإنجازات الرائعة.
هذا البحث لا يقتصر على إشباع فضولنا فحسب. إن الفهم الأعمق لهذه العمليات الداخلية قد يؤدي إلى:
- تحسين قابلية التفسير: توضيح سبب قيام نموذج ما بتنبؤ معين أو إنتاجه لمخرجات محددة.
- تحسين التحكم: مما قد يسمح لنا بتوجيه أو تعديل عملية التفكير في النموذج بفعالية أكبر.
- تحسين التوافق: إن فهم كيفية وصول النماذج إلى استنتاجاتها أمر بالغ الأهمية لضمان سلامتها وتوافقها مع القيم الإنسانية.
الخاتمة
إن رحلة فهم "بيولوجيا" نماذج اللغة الكبيرة قد بدأت للتو، ويبدو أن الرسوم البيانية للإسناد أداة حيوية في مساعدتنا على رسم خريطة لهذا المشهد الرائع والمتزايد الأهمية. إنه وقت مثير لاستكشاف عقول هذه الشركات الرقمية العملاقة!

تعليقات
إرسال تعليق