تنقيب في النصوص

التنقيب في النصوص، وأحيانا يشار إليها بالتناوب باسم التنقيب في البيانات النصية، أي ما يعني تقريبا تحليلات النصوص، يشير إلى عملية استخلاص معلومات عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل التعلم الإحصائي للانماط. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في قاعدة بيانات)، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من الصلة، والحداثة، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل تصنيف النصوص، تجميع النص، واستخراج مفهوم/كيان، وإنتاج التصنيفات الحبيبية، وتحليل المشاعر، وتلخيص الوثيقة، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين الكيانات المسماة).

cs:Dolování z textu de:Text Mining Text mining]] es:Minería de textos fr:Fouille de textes hu:Szövegbányászat id:Penambangan teks ja:テキストマイニング nl:Text mining pl:Text mining pt:Mineração de texto ru:Анализ текста sv:Text mining th:การทำเหมืองข้อความ zh:文本挖掘