دليل Semalt على تمديد مكشطة لكروم

لكي تتمكن أي شركة من البقاء والنمو في نهاية المطاف ، من الضروري أن تظل في صدارة منافسيها ومخاطرها المختلفة. يعد اتخاذ القرارات بناءً على البيانات التحليلية طريقة أكيدة لنسيان هذه المشاكل. يمكن الحصول على هذه البيانات من خلال إلغاء البيانات. هذا هو المكان الذي تأتي فيه إضافة المكشطة السهلة لمتصفح Chrome: فهي لن تسهل عملية تجميع البيانات فحسب ، بل ستجعل من الممكن أيضًا أن تتخلص أثناء التنقل بدون إعدادات معقدة.

كيفية استخدام الكاشطة

    1. أول ما عليك فعله هو تثبيت الإضافة ، لذا توجه إلى متجر Chrome الإلكتروني ، وابحث عن "scraper" وانقر على "إضافة إلى Chrome".

    2. انتقل إلى موقع الويب الذي تنوي استخلاص البيانات منه ، وقم بتمييز الإدخال الذي تريده من خلال تمييزه. انقر بزر الماوس الأيمن عليه وحدد "scrape مماثلة" في القائمة المنبثقة.

    3. سيؤدي ذلك إلى تشغيل نافذة وحدة تحكم مكشطة منفصلة. هنا ، سترى قائمة بالبيانات المسحوبة .

    4. لحفظ المحتوى ، انقر فوق "حفظ في مستندات Google" ، وهذا سيؤدي إلى تصدير البيانات تلقائيًا إلى جدول بيانات Google.

كشط ممتد

إذا كنت تخطط لاكتساب المزيد من البيانات ، يمكنك استخدام النهج المتقدم. لاحظ أنه سيكون من الأسهل العمل مع الأداة إذا كان لديك بعض المعرفة بـ HTML. لنفترض أنك تريد استخلاص البيانات من مصدر يحتوي على أرشيف بناءً على بيانات السلاسل الزمنية. في هذه الحالة ، إذا جربت الطريقة الموضحة أعلاه ، فستحصل على البيانات المشوشة.

لحل هذه المشكلة ، يمكنك الاستفادة من لغة استعلام HTML و XML المعروفة باسم XPath. ماذا تعمل، أو ماذا تفعل؟ يتعرف XPath على البيانات المتعلقة بالعناصر المختلفة الموجودة في كل تحديد. فيما يلي دليل حول كيفية القيام بذلك:

1. انتقل إلى وحدة التحكم Scraper ، في الجزء العلوي الأيسر ، ستلاحظ زر "XPath" ، انقر فوقه وتابع إلى تجميع الجدول الأولي.

2. تحتاج إلى كتابة XPath للعنصر الصحيح. سيتم عرض XPath الحالي الذي يتضمن المعلومات الكاملة بتنسيق مثل هذا "// div [3] / div [3] / div [2] / div". سيتم التعرف على عناصر <div> في مستند HTML بواسطة الكمبيوتر.

3. لفصل البيانات المعترف بها ، يجب عليك استخدام أعمدة الكاشطة. للقيام بذلك ، تحتاج إلى البحث عن أنواع مختلفة من المعلومات المتوفرة لديك. اعتمادًا على البيانات التي تتخلص منها ، قد يكون لديك عناوين. هذه العناوين موجودة بجانب كل مجموعة من البيانات. تكون مصحوبة بعلامة ، في هذه الحالة ، علامة <b>.

4. باستخدام عنصر الفحص ، حدد موقع العلامة <b> وأضفها إلى XPath. الآن يمكنك تسمية هذا العمود الأول باسم "عمود العنوان" حيث سيتم سرد العناوين. تابع إنشاء مسارات XPath مختلفة لكل عمود تحتاج إليه.

5. انقر على الكشط وسوف يقوم الامتداد بجمع البيانات تلقائيًا وتنظيمها في الأعمدة المختلفة التي قمت بتعيينها.