حتى خبراء الذكاء الاصطناعي ينسخون في واجباتهم: بناء قاعدة معرفة شخصية فعالة باستخدام LLM Wiki

robot
إنشاء الملخص قيد التقدم

撰写:Biteye 核心贡献者 Shouyi

*全文约 2300 字,预计阅读时间为 6 分钟

每天给 AI 喂材料,它转头就忘;Token 狂烧,知识库最后全建成了「烂尾楼」?

前 OpenAI 联合创始人/Tesla AI 总监 Andrej Karpathy @karpathy 刚给出了终极解法。4 月 3 日,他发了一条浏览量超 17M的推文,并开源了硬核指南 llm-wiki。

这份斩获 5000+ Stars 的指南提出:用大模型来建个人知识库,自此告别「盲目烧 Token」,让知识像数字资产一样「自动生息」。

今天,小编直接为你硬核拆解这套连大佬都在用的实用教程!

01 为什么你以前搞知识库总失败?

在开始搭建之前,先了解两种最常见的失败模式,避免重蹈覆辙。

  1. تقليدي RAG (الاسترجاع المعزز)

أكبر نقطة ألم في هذا النوع من الأنماط هي حرق Token مع「نسيان عجيب」。عندما ترمي عليه بضع عشرات الآلاف من الكلمات، مثل كتيبات白皮书 (البيانات التعريفية) حول عالم العملات أو أحدث أبحاث AI، فإنه يقرأ بصعوبة ثم يلخّص لك نسخة مختصرة لتوفير الوقت. النتيجة: الأسبوع التالي عندما تسأله: «ما الفرق بين المشروع الذي ذكرتَه الأسبوع الماضي وبين منافس اليوم؟» فهو يتذكر فقط ذلك الملخص الهزيل الذي تم تلخيصه في البداية. لأن كل استدعاء يعتمد على استرجاع متقطع ومجزأ، لا تتكون ترسّبات معرفية مُهيكلة، وبالتالي استهلاك الـ Token يكون هائلاً.

  1. Wiki تقليدي (ملاحظات يدوية)

يمتاز هذا النوع بأنه عمل يدوي خالص: وسم الوسوم، بناء روابط مزدوجة، إنشاء فهرس… لخص Karpathy الأمر في جملة واحدة تكشف الحقيقة: «ليس السبب الحقيقي وراء كون تنظيم المعرفة متعباً هو القراءة والتفكير، بل هو ‘دفتر الحسابات’ (التصنيف، التنسيق).» الإنسان سيتعب، بينما الذكاء الاصطناعي سيكون دائماً متاحاً. في السابق كانت هذه الأعمال القذرة تُنفَّذ بالكامل بجهد البشر، وكانت النتيجة الطبيعية هي الإحباط.

02 تفكيك المنطق: خط الأنابيب «شبه كامل الأتمتة» في LLM Wiki

الركيزة الأساسية في حل Karpathy هي تبديل الدور: أنت فقط تقوم بدور «جالب المادة»، أما الأعمال المتسخة والمجهدة فكلها تُسلَّم للذكاء الاصطناعي. يتكون هذا النظام من ثلاث طبقات منطقية:

الطبقة الأولى: مستودع المواد الخام (دخول فقط بلا خروج)

الأبحاث المتعمقة، التغريدات الطويلة، دروس AI، وتسجيلات البودكاست التي تراها عادةً—انسخها وألقِها مباشرة إلى هنا. هذا المكان هو «مصدر حقيقة واحد» بشكل مطلق، ولا يُسمح للنموذج الكبير إلا بالمشاهدة، ولا يُسمح بتعديلها على الإطلاق.

الطبقة الثانية: منطقة قلب الـ Wiki (تولي الذكاء الاصطناعي كامل الصلاحية)

هنا كل شيء عبارة عن ملفات Markdown خالصة. أنت لا تحتاج إطلاقاً للقلق بشأن التنسيق؛ سيتولى الذكاء الاصطناعي تلقائياً استخلاص المواد الخام إلى «بطاقات مفاهيم»، و«جدول مقارنة منافسين/مشاريع داخل نفس المسار». أنت فقط تقرأ، والذكاء الاصطناعي مسؤول عن الكتابة والتحديث.

الطبقة الثالثة: قواعد SOP (قوانين منزلك)

اكتب ملف CLAUDE.md أو GPT.md كتكوين، وأخبر الذكاء الاصطناعي بقواعدنا. على سبيل المثال: «تجب استخلاص اقتصاديات الرموز وخلفية الفريق من جميع تقارير أبحاث العملات»، «يجب أن تلخّص جميع دروس AI 3 أكواد Prompt قابلة للتنفيذ».

03 دليل عملي: من «حرق Token» إلى «زيادة قيمة الأصول» بثلاث خطوات، كيف تُشغّل الخط الآن؟ الخطوات الثلاث الأساسية التالية تجعل قاعدة المعرفة تبدأ فوراً في «الاستفادة تلقائياً»:

الخطوة 1: إدخال تلقائي إلى المخزن (Ingest)

مثال عملي على龙虾: ألقيت داخل النظام تقرير أبحاث عميق عن Web3 طوله 20 ألف كلمة، وتركت عبارة: «سجّل هذا من أجلي».

تنفيذ AI: في الخلفية يقرأ بسرعة كاملة، ولا يقوم فقط بإنشاء ملف 项目 A_ملاحظات بحث وتطوير.md تلقائياً، بل يقوم أيضاً بتحديث ملف دليل目录.md العام لديك، وحتى قد يضيف هذا المشروع الجديد بشكل استباقي داخل ملف تحليل منافسين/مشاريع ضمن نفس المسار الذي كتبته سابقاً: 赛道竞品分析.md. مرة واحدة فقط، فيترابط الجميع عبر الشبكة!

الخطوة 2: طرح الأسئلة و«فوائد المعرفة المركبة» (Query)

مثال عملي على龙虾: سألت عابراً: «اجمع آخر 5 مقالات لدي حول تقنيات Prompt الخاصة بنماذج اللغة الكبيرة، واكتب نصاً جذاباً لبوست على Xiaohongshu». سيقوم الذكاء الاصطناعي فوراً باستدعاء جوهر مكثّف عالياً لمساعدتك في كتابة المحتوى.

فوائد المعرفة المركبة: شدد Karpathy على أنه لا يجوز أن تبقى الأسئلة الجيدة والأجوبة الجيدة في مربع الدردشة لتأخذ الغبار! إذا كنت تعتقد أن هذا الملخص ممتاز، أعطِ الذكاء الاصطناعي أوامر مباشرة: «احفظ هذا الملخص داخل Wiki، وأنشئ صفحة جديدة باسم Prompt 万能模板.md.» هذا فعلاً هو «إعادة رهن» للمعرفة (Restaking)، كلما استخدمته زاد السُمك!

الخطوة 3: تنظيف شامل في وقت متأخر من الليل (Lint)

مثال عملي على龙虾: قبل النوم أصدر تعليمات: «أجرِ فحصاً لقاعدة المعرفة».

تنفيذ AI: يقوم بمسح شامل عالمياً مثل روبوت يكنس الأرض. في صباح اليوم التالي يبلّغك: «يا مدير، الأداة الخاصة بالذكاء الاصطناعي التي خزّنتها في الشهر الماضي أصبحت مدفوعة الآن، وهو تعارض منطقي مع ‘دليل الاستغلال المجاني’ الذي خزّنته أمس—هل تريد مني تحديثها؟»

04 إعدادات متقدمة: Obsidian + نموذج كبير = الإضافة الخارقة النهائية

عندما حاول الناس سابقاً الاحتفاظ بالذاكرة على المدى الطويل، كانت هناك عقدة واحدة: لم تكن تخلو من قواعد بيانات متجهة معقدة، لكن هذا مستوى حاجز مرتفع جداً بالنسبة لمعظم الأشخاص، وإذا لم يكن البحث المحلي قوياً فستكون التجربة عديمة الفائدة إلى حد كبير. يوصي Karpathy بأفضل تركيبة نهائية: Obsidian (برنامج ملاحظات محلي) + نموذج كبير.

Obsidian يشبه محرر الكود، بينما النموذج الكبير هو مبرمجك المتعاقد. بالتخلي عن قواعد بيانات معقدة، لا تحتاج إلا إلى ملفّين أساسيين لتقليل استهلاك Token إلى حد كبير:

index.md (مخطط شامل): يسجل ملخصات وروابط كل الصفحات. قبل أن يجيب الذكاء الاصطناعي عن أي سؤال، يقوم بمسح المخطط أولاً ثم يستدعي الملاحظات المطابقة بدقة، بدون إعادة قراءة مئات الآلاف من الكلمات في كل مرة. ينخفض استهلاك Token بنسبة 90%!

log.md (سجل العمليات اليومي): يسجل ما الذي قام به AI كل يوم، وأي ملف قام بتعديله، بالترتيب الزمني، لتتمكن دائماً من «مراجعة الدوام» في أي وقت.

وبالتوافق مع Obsidian ميزة قصّ/التقاط صفحة واحدة من الويب بنقرة واحدة وخريطة «عالم النجوم للمعرفة» الشامل، يمكن أيضاً جعل قاعدة المعرفة مرئية.

05 الخلاصة: ابدأ عصر «تنمية معرفتك ذاتياً»

في عصر انفجار المعلومات لعام 2026، من يستطيع ترسيخ المعرفة بأقل تكلفة احتكاك، سيكون قادراً على تحريك أكبر رافعة باستخدام أقل عدد من Tokens.

كما أن Karpathy في هذه المرة لم يطلق كوداً جامداً، بل أطلق «ملفاً أيديولوجياً» مكتوباً ليقرأه الذكاء الاصطناعي. كل ما تحتاجه هو أن تطعم رابط دليله إلى Agent الخاص بك، لتبدأ وضعية تحقيق الربح بسهولة.

حرّك قاعدة المعرفة، اجعل Token لا ينفد، ولم يعد الجمبري لديك جمبرياً لا يُطعم ولا يُستأنس!

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.4Kعدد الحائزين:2
    0.81%
  • القيمة السوقية:$2.27Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.28Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.28Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:2
    0.00%
  • تثبيت