Facts About البيانات الضخمة Revealed
Facts About البيانات الضخمة Revealed
Blog Article
وبالتالي ، يمكن للمهنيين الآخرين إجراء تحليل البيانات ذات الصلة.
إن عالم تحليلات البيانات الضخمة مبني على أكتاف العمالقة: إن إمكانات جمع البيانات وتحليلها معروفة منذ عقود ، إن لم يكن لقرون.
ومع ازدياد حجم الاختلاف لهذه البيانات الضخمة التي نحتاجها نستخدمها في مختلف القطاعات والشركات، حيث أصبحت اليوم أمام خيارين أساسيين، أحدهما الاستغناء عن هذه البيانات، أو البدء بالتعامل معها بشكل أفضل لتحليلها والإستفادة منها. وتظهر التحديات أمام تقنيات إدارة قواعد البيانات التقليدية في التعامل مع البيانات المختلفة وبالسرعة اللازمة، حيث كانت قواعد البيانات التقليدية تتعامل مع المستندات النصية والأرقام فقط، أما البيانات الضخمة اليوم تحوي أنواع جديدة من البيانات التي لا يمكن تجاهلها، لكن مع استخدام الأدوات التقليدية مسبقاً لن نتمكن من تحليل والاستفادة من هذه البيانات الجديدة الضخمة.
أما بالنسبة لنوعية البيانات الضخمة، فهي تشمل مجموعة متنوعة من الأشكال والأنماط. يمكن أن تكون البيانات الضخمة نصوصًا، وصورًا، ومقاطع فيديو، وملفات صوتية، ومستندات إلكترونية، وسجلات مستخدمين، والمزيد.
تتضمن عملية معالجة البيانات الكبيرة عدة خطوات أساسية، بدءًا من جمع البيانات وتخزينها في قواعد بيانات موثوقة وسهلة الوصول.
يشير التنوع إلى مجموعة المصادر التي يمكن للشركة من خلالها الحصول على البيانات الضخمة ومجموعة كبيرة من التنسيقات التي يمكن أن تظهر بها.
ويطلق مصطلح البيانات الضخمة على مجموعة من حزم البيانات الضخمة والمعقّدة والتي يصعب التعامل معها من خلال نظم إدارة قواعد البيانات التقليدية من كافة النواحي لتشكل بذلك التخزين، البحث، التمثيل، التحليل.
تتميز البيانات الضخمة بثلاثة سمات رئيسية وهي الحجم الكبير للبيانات المتاحة، وسرعة تدفقها وتجديدها، وتنوعها في الأشكال والأنماط.
يمكن تعريف البيانات المهيكلة بدقة على أنها البيانات الموجودة في حقل ثابت داخل سجل. إنه مرتبط بمخطط معين ، وبالتالي فإن جميع البيانات لها نفس مجموعة الخصائص.
جاء هذا الانفجار البيانات الضخمة في جمع البيانات من القدرة على أتمتة عملية الجمع حيث كان على المستخدمين تاريخيًا تقديم ملاحظات في شكل استطلاعات رأي ومكالمات هاتفية وما إلى ذلك.
مع زيادة حجم واستخدام البيانات الضخمة، تنشأ مشاكل الخصوصية والأمان التي يجب معالجتها بجدية.
التنوع والتعقيد: تشتمل البيانات الكبيرة على مصادر متعددة ومتنوعة، بما في ذلك النصوص الكتابية والصور وملفات الوسائط المتعددة، وتكون متنوعة في صيغة وهيكل البيانات.
وهذا يتطلب استخدام تقنيات متقدمة لمعالجة وتحليل هذا النوع المتنوع من البيانات.
البيانات - إنها موجودة منذ فترة (ولو كانت في صورة رقمية حتى). ما الذي يجعل البيانات "ضخمة" ومن أين تأتي هذه البيانات الضخمة؟