ویب پر گرفت اور تبدیل کرنے کے اوزار

ویب سکریپر دستاویزات

ویب سکریپ بنانے کے ل you ، آپ کو درج ذیل ٹیبز میں پھیلی ہوئی پانچ قسم کی معلومات بتانا ہوں گی۔

  1. سکریپ کے اختیارات
  2. ٹارگٹ ویب سائٹ
  3. سکریپ ہدایات
  4. برآمدات کے اختیارات
  5. شیڈول کھرچنا

سکریپ کے اختیارات

سکریپ آپشنز ٹیب پر درج ذیل تمام خصوصیات ویب اسکریپ کو اپنی مرضی کے مطابق کرنے کے لئے دستیاب ہیں۔

سکریپ نام سکریپ کا نام۔

روابط پر عمل کریں مندرجہ ذیل اختیارات فراہم کرتے ہیں کہ کس طرح تراشے ہوئے لنکس کی پیروی کرنا چاہئے:

فائل ڈاؤن لوڈ کو نظرانداز کریں ایک بار کوئی بھی لنک مرتب کریں ، جس کی وجہ سے فائل ڈاؤن لوڈ ہوجائے جب ڈاؤن لوڈ نہ کیا جائے۔

روبوٹس ڈاٹ ٹی ایس ٹی فائل کو نظرانداز کریں اگر سیٹ کیا جاتا ہے تو کھرچنے والے ویب صفحات کو عام طور پر ویب سائٹ کے مالک کے ذریعہ کرال ہونے سے خارج کر سکتے ہیں۔

خرابی والے صفحات کو نظر انداز کریں۔ اگر ویب سکریپر سیٹ کیا جاتا ہے تو وہ کسی بھی ویب صفحات کو چھوڑ دے گا جو غلطی کی اطلاع دیتے ہیں۔ لہذا کوئی بھی HTTP اسٹیٹس کوڈ 400 یا اس سے اوپر۔

یو آر ایل کے ٹکڑوں کو نظر انداز کریں۔ اگر سیٹ کیا جاتا ہے تو ویب سکریپر URL کے بعد کے حصے کو نظر انداز کر دے گا۔ # یہ خصوصیت عام طور پر ایک ہی صفحہ پر بک مارک کو ظاہر کرنے کے لیے استعمال ہوتی ہے اور اس کے نتیجے میں عام طور پر غیر ضروری صفحات کو سکریپ کیا جاتا ہے۔ تاہم، کچھ ویب سائٹس اس خصوصیت کو مختلف مواد دکھانے کے لیے استعمال کرتی ہیں، ایسی صورت میں اس ترتیب کو غیر فعال کرنے کی ضرورت ہے۔ یہ اختیار صرف اس وقت لاگو ہوتا ہے جب فالو لنکس کی ضرورت کے مطابق نہ ہو۔

نقلی نظرانداز کریں اگر سیٹ کیا گیا تو یہ ایسے صفحوں کو نظر انداز کردے گا جو آپ کے مماثلت کے برابر یا اس سے زیادہ ہیں ، مثال کے طور پر آپ ایسے صفحوں کو نظر انداز کرسکتے ہیں جو 95٪ ایک جیسے ہیں۔

حد کھرچنا آپ کو یہ بتانے کی اجازت دیتا ہے کہ رکنے سے پہلے کتنے صفحات کو کھرچنا چاہئے۔

میرا ٹائم زون کا استعمال کریں اگر سیٹ کیا گیا تو یہ اس بات کی نشاندہی کرتا ہے کہ ویب کھرچنے والی کسی بھی تاریخ کو ختم کرنے کی کوشش کرنی چاہئے into آپ کا مقامی ٹائم زون آپ کا ٹائم زون اکاؤنٹ پیج پر سیٹ کیا جاسکتا ہے۔

جگہ جغرافیائی محل وقوع سے ویب سکریپر اس اسکریپ کو انجام دے گا۔ اگر کارفرما ویب سائٹ میں مقام کی بنیاد پر پابندیاں ہوں تو یہ کارآمد ثابت ہوسکتی ہے۔

ڈیفالٹ تاریخ کی شکل جب تاریخوں کو تبدیل کرنا جہاں تاریخ کی شکل کا تعین نہیں کیا جاسکتا ہے تو ، ویب کھرچنے والی بجائے اس منتخب شدہ شکل میں ڈیفالٹ ہوجائے گی۔

پیج لوڈ میں تاخیر یہ وقت سیکنڈ سیکنڈ میں ہے جب ویب کھرچنے والے کو کسی صفحے کی تجزیہ کرنے سے پہلے انتظار کرنا چاہئے۔ اگر یہ ایک صفحہ بہت زیادہ AJAX پر مشتمل ہے یا لوڈ کرنے میں سست ہے تو یہ بہت مفید ہے۔

ٹارگٹ ویب سائٹ

ٹارگٹ ویب سائٹ

ٹارگٹ ویب سائٹ ٹیب میں آپ ان ویب سائٹس کی وضاحت کرتے ہیں جن سے آپ ڈیٹا نکالنا چاہتے ہیں۔ کسی ویب سائٹ سے ڈیٹا نکالنے کے لیے سکریپ ٹول کو بتانے کے لیے آپ کو پہلے مرکزی یو آر ایل کی وضاحت کرنی ہوگی۔ intمثال کے طور پر http://www.example.com/shop/ یہ تھا کھرچنی اپنی کھرچنا شروع کردے گی ، یہ عام ویب پیج ، پی ڈی ایف دستاویز ، ایکس ایم ایل دستاویز ، جے ایس این دستاویز ، آر ایس ایس فیڈ یا سائٹ کا نقشہ ہوسکتا ہے۔ اگر یہ ویب صفحہ یا پی ڈی ایف دستاویز نہیں ہے تو کھرچنی فائل میں موجود تمام لنکس کو تلاش کرے گی اور ہر ایک کو ملاحظہ کرے گی۔

صرف ہدف کے یو آر ایل میں پائے جانے والے لنکس کی پیروی کرنے کے ل and اور نہ ہی اس کے بعد کے صفحات جو آپ سیٹ کرسکتے ہیں روابط پر عمل کریں کھرچنا آپشن کرنے کے لئے پہلے صفحے پر. یہ ہدف URL کو صرف باقی اسکریپ کو ختم کرنے کے لئے استعمال کرے گا۔

یو آر ایل پیٹرن

پہلے سے طے شدہ طور پر ، ویب کھرچنے والا ہر اس لنک کی پیروی کرتا ہے جس کا پتہ لگانے والے ہر ویب صفحے پر اس کا پتہ چلتا ہے۔ اگر آپ اس بات پر پابندی لگانا چاہتے ہیں کہ لنک کیا ہے ویب کھرچنی اس کے بعد، ایسا کرنے کا ایک آسان طریقہ یو آر ایل پیٹرن کی وضاحت کرنا ہے۔ یہ طاقتور تکنیک بنیادی طور پر ستارے کے ساتھ یو آر ایل کو وائلڈ کارڈ کے طور پر بتا کر کام کرتی ہے تاکہ یہ ظاہر کیا جا سکے کہ پیٹرن کے اس حصے میں کوئی بھی حروف موجود ہو سکتے ہیں۔ مثال کے طور پر http://www.example.com/*/articles/* ویب سائٹ کی جڑ سے دوسری ڈائرکٹری کے بطور مضامین موجود کسی بھی URL کو ختم کردیں گے۔

یو آر ایل کے نمونوں کی وضاحت کرنے کا ایک اور پابند طریقہ یہ ہے کہ متبادلات کی وضاحت کی جائے۔ مثال کے طور پر یہ مثال صرف اسٹور یا خبروں سے مل سکے گی: http://www.example.com/ /*

لہذا یہ اس سے مماثل ہوگا http://www.example.com/store/products/1 لیکن نہیں http://www.example.com/about/.

یا متبادل طور پر کسی چیز کے علاوہ ہر چیز سے مماثل ہونا ممکن ہے۔ مثال کے طور پر یہ مثال اسٹور یا خبر سے مماثل نہیں ہوگی: http://www.example.com/ /*

لہذا یہ اس سے مماثل ہوگا http://www.example.com/about/ لیکن نہیں http://www.example.com/store/products/1!

URL پیٹرن میں کلیدی الفاظ بھی شامل ہو سکتے ہیں۔ کلیدی لفظ وہ چیز ہے جو ڈبل مربع بریکٹ میں موجود ہو۔ تو [[URL_START]]www.example.com* یو آر ایل کے کسی بھی درست آغاز سے مماثل ہوگا۔ http://www.example.com/, https://www.example.com/ یا اس سے بھی ftp://www.example.com/ مثال کے طور پر.

بیج یو آر ایل کی

بیج یو آر ایل صارف کو یو آر ایل کی فہرست متعین کرنے کی اجازت دیتے ہیں جن کو ویب سکریپر کے ذریعہ کرال کیا جانا چاہئے۔ اگر آپ صرف بیج یو آر ایل کو ختم کرنا چاہتے ہیں تو سیٹ کریں روابط پر عمل کریں کھرچنے کے اختیارات کرنے کے لئے کوئی صفحات نہیں سکریپ آپشنز ٹیب میں۔

ٹارگٹ ویب سائٹ ٹیب پر سیڈ یو آر ایل سیٹ کرنے کے لیے، ایڈ ٹارگٹ بٹن پر کلک کریں پھر سیٹ سیڈ یو آر ایل چیک باکس کو چیک کریں اور ہر یو آر ایل کو الگ لائن پر سکریپ کرنے کے لیے مخصوص کریں۔

ٹیمپلیٹ یو آر ایل سے بیج یو آر ایل بنائیں

متبادل کے طور پر آپ ٹیمپلیٹ یو آر ایل کا استعمال کرکے خود بخود بیج یو آر ایل تیار کرسکتے ہیں ، یہ ایک واحد URL ہے جس میں یو آر ایل متغیر بھی شامل ہے۔ یو آر ایل متغیر متعدد اعداد کی حد طے کرتا ہے جس پر اعادہ کیا جاسکتا ہے۔

اسٹارٹ نمبر وہ نمبر ہے جس میں یو آر ایل متغیر کی گنتی شروع ہونی چاہئے ، اختتامی نمبر وہ نمبر ہے جس میں یو آر ایل متغیر گنتی بند کردے گا ، اعداد نمبر وہ نمبر ہے جس میں یو آر ایل کے متغیر کی ہر تکرار کے لئے تعداد میں اضافہ ہوگا۔

مثال کے طور پر مندرجہ ذیل ٹیمپلیٹ یو آر ایل کیلئے http://www.example.com/search?pageNo=

اس کے بعد درج ذیل بیج یو آر ایل تشکیل دیں گے۔

پوسٹ انجام دیں

URL بھی POST پر پیرامیٹرز کے ساتھ ایک URL کی وضاحت کرسکتا ہے مثال کے طور پر لاگ ان فارم۔ ایسا کرنے کے لئے ٹارگٹ یو آر ایل ٹیکسٹ باکس میں فارم یو آر ایل کی وضاحت کریں اور استعمال کرنے کیلئے مطلوبہ پوسٹ پیرامیٹرز کو شامل کریں۔ متغیر کے بعد والے اقدار میں خصوصی GrabzIt متغیرات بھی شامل ہوسکتے ہیں ، جیسے:

سکریپ ہدایات

سکریپ ہدایات ویب سکریپر کو بتاتی ہیں کہ جب ہدف کی ویب سائٹ کو ختم کیا جاتا ہے تو کیا کام کرنا ہے۔ سکریپ ہدایات کا ٹیب اسکریپ وزرڈ کو بطور ڈیفالٹ دکھاتا ہے ، جس کی وجہ سے آپ کو مطلوبہ سکریپ ہدایات کو شامل کرنا آسان ہوجاتا ہے۔ اس وزرڈ کے استعمال کی ایک عمدہ مثال the in میں دکھائی گئی ہے مصنوعات کی فہرست اور تفصیل سکریپنگ سبق.

ایک بار جب آپ سکریپنگ شروع کرنے کے لئے تیار ہوجائیں تو دبائیں سکریپ کی نئی ہدایت شامل کریں لنک.

اس سے یہ مددگار کھل جائے گا اور ہدف کا یو آر ایل خود بخود لوڈ ہوجائے گا ، جس سے آپ کو فوری طور پر منتخب کرنے کی اجازت مل جائے گی کہ آپ کیا ختم کرنا چاہتے ہیں۔ اگر کسی ویب پیج یا پی ڈی ایف دستاویز کو لوڈ کیا گیا ہے تو آپ کسی بھی لنک پر کلیک کرسکتے ہیں اور یہ معمول کی طرح کام کرے گا ، مثال کے طور پر کسی اور ویب پیج پر جائیں۔ جب تک آپ اس پو میں سکرین کے نیچے ، کسی ایک عمل کا انتخاب نہیں کرتے ہیںint اس مواد پر کسی بھی کلکس کا HTML عنصر منتخب کریں گے جس کی آپ نکالنا چاہتے ہیں یا جوڑ توڑ کرنا چاہتے ہیں۔

سکریپ ہدایات کے بارے میں سمجھنے میں پہلی بات یہ ہے کہ وہ ہر ویب صفحے پر بطور ڈیفالٹ عمل میں لائے جاتے ہیں۔ اس کو روکنے کا طریقہ ٹیمپلیٹس کے استعمال سے ہے۔ کسی کام کو انجام دینے کے وقت ٹیمپلیٹ تفویض کیا جاسکتا ہے جیسے کسی لنک پر کلک کرنا اور جب بھی کھرچنے والا اس لنک پر جاتا ہے یا اس بٹن پر کلیک کرتا ہے تو اسے پہچان لیا جاتا ہے کہ یہ تفویض کردہ ٹیمپلیٹ کا ہے۔ اس سے صفحہ کی مختلف اقسام کی وضاحت کی جاسکتی ہے۔ مثال کے طور پر آپ کے پاس مصنوعاتی زمرے کا صفحہ ہوسکتا ہے جس میں کچھ جائزہ معلومات اور پھر ایک تفصیل والا صفحہ ہو جس میں مصنوعات کی معلومات ہو۔ دونوں صفحات کو شاید کھرچنی ہدایات کے مختلف سیٹ کی ضرورت ہوگی۔

کھرچنی سانچہ

شروع کرنے کے لئے منتخب کریں کلک کریں ایکشن ، پھر ایک بار جب آپ آئٹمز منتخب کرلیں تو آپ عمل پر کرنا چاہتے ہیں اور پر کلک کریں اگلے بٹن میں سانچے کا نام درج کریں ایک سانچہ بنائیں ٹیکسٹ باکس اب جب بھی کھرچنی ان کارروائیوں کو انجام دیتا ہے ، واپس کیا گیا ٹیمپلیٹ وہ نام ہوگا جو آپ نے فراہم کیا ہے۔

پھر کسی سکریپ ہدایت کو کسی خاص ٹیمپلیٹ کو تفویض کرنے کے ل you آپ کو مطلوبہ ٹیمپلیٹ کو منتخب کرنے کی ضرورت ہے میں عملدرآمد ڈراپ ڈاؤن لسٹ ، جو اسکریپ انسٹرکشن کو شامل کرنے سے بالکل پہلے آپشنز ونڈو میں ظاہر ہوتی ہے۔ ٹیمپلیٹ کا انتخاب کرتے وقت تین اہم اختیارات مندرجہ ذیل ہیں۔

ایک بار جب آپ ان میں سے ایک آپشن منتخب کرلیتے ہیں ، تو اسکریپ کی ہدایت صرف متعین ٹیمپلیٹ پر ہوگی۔

ڈیٹا نکالنا

آپ محسوس کریں گے کہ جب آپ منتخب کریں گے ڈیٹا نکالیں عمل. اسکرین کے نیچے بائیں کونے سے آپ کو ونڈو میں کسی HTML عنصر کو منتخب کرنے یا گلوبل پیج پراپرٹی کا انتخاب کرنے کی دعوت دی گئی ہے۔

گلوبل پیج پراپرٹی استعمال کرنے کے لئے ، پر کلک کریں عالمی صفحہ جائیداد لنک. پھر تصدیق کریں کہ آپ جاری رکھنا چاہتے ہیں۔ اب آپ کے پاس پراپرٹیز کی فہرست ہوگی جو صفحہ سے سیدھے نکالی جاسکتی ہے۔ مثال کے طور پر: صفحہ کا عنوان۔

کسی کو منتخب کرنے کے ل just ، اسے اختیارات کی فہرست میں سے منتخب کریں اور کلک کریں اگلے میں ڈیٹا شامل کرنے کے لئے ڈیٹاسیٹ.

اگر آپ پورے HTML سے متعلق مخصوص HTML عناصر میں ڈیٹا نکالنا چاہتے ہیں تو آپ کو متعلقہ HTML عناصر پر کلک کرنے کی ضرورت ہے ، آپ واحد یا ایک سے زیادہ آئٹمز منتخب کرسکتے ہیں۔ تاہم اگر آپ متعدد آئٹمز کا انتخاب کررہے ہیں تو براہ کرم کوشش کریں اور متعدد آئٹمز منتخب کریں جو اس کے بعد کالم میں ایک سے زیادہ قطاروں کی طرح ہوں ، کیونکہ اگر کھرچنی والا کوئی قاعدہ تشکیل نہیں دے سکتا ہے جو اعداد و شمار کے منتخب کردہ مجموعہ کی انفرادی طور پر شناخت کرسکے تو سکریپ ہدایت نہیں ہوگی۔ تخلیق کرنے کے قابل ہو۔ مزید برآں اگر آپ متعدد آئٹمز پر کلک کر رہے ہیں جن کی شناخت ہمارے ویب اسکریپر وزرڈ کے ذریعہ اعداد و شمار کو دہرانے کے طور پر کی گئی ہے تو ، اسی گروہ میں موجود سبھی اعداد و شمار خود بخود منتخب ہوجائیں گے۔ ایک بار جب آپ اپنے تمام سنگل یا متعدد آئٹمز منتخب کرلیں تو اسکرین کے نیچے بائیں طرف سے نکالنے کے ل a کسی وصف کا انتخاب کریں اور پھر کلک کریں اگلے.

ڈیٹاسیٹ بنانا

ڈیٹاسیٹ اسکرین آپ کو اعداد و شمار کے طریقہ کار کو تبدیل کرنے کی اجازت دیتی ہے ، مثال کے طور پر آپ اس کے اندر موجود ڈیٹاسیٹ اور کالموں کا نام تبدیل کرسکتے ہیں ، صرف نام تبدیل کرنے کے لئے نام پر کلک کریں۔ جب آپ کسی ڈیٹاسیٹ میں کالم شامل کرتے ہیں تو آپ کو اس سانچے کو بھی منتخب کرنے کی ضرورت ہوتی ہے جس میں اس کو پھانسی دی جانی چاہئے۔ آپ کالم کے نام کے نیچے واقع ڈراپ ڈاؤن لسٹ پر کلک کرکے اس کو تبدیل کرسکتے ہیں۔

اکثر اعداد و شمار کو نکالنے کے دوران ، کچھ دہرانے والی اشیا کے لئے یہ متمنی ہے کہ وہ متضاد طور پر دہرائیں ، اس بات کا یقین کرنے کے لئے کہ صحیح قطاریں اب بھی ایک دوسرے کے ساتھ وابستہ ہیں۔ کالم لنک کریں معیار ، متضاد کالموں کو ڈیٹاسیٹ کے انتہائی مستقل کالم کے ساتھ جوڑنے کے لئے۔

ڈیٹاسیٹ میں مزید ڈیٹا شامل کرنے کے لئے پر کلک کریں بٹن پر کلک کریں ، یا کلک کریں ڈیٹاسیٹ سے ڈیٹا کو ہٹانے کے ل or ، یا پورے ڈیٹاسیٹ کو حذف کرنے کے لئے۔ ڈیٹاسیٹ اعداد و شمار پر مختلف معیارات کا اطلاق کرنے کی بھی اجازت دیتا ہے ، ایسا کرنے کے لئے اوپر سے مطلوبہ کارروائی کا انتخاب کریں اور پھر معیار کو لاگو کرنے کے لئے متعلقہ کالم پر کلک کریں۔ اگر آپ کسی معیار کو شامل کرنے میں غلطی کرتے ہیں تو صرف کلک کریں بٹن پر کلک کرنا ہے۔

مختلف معیار کی اقسام کی فہرست اور ان کو استعمال کرنے کا طریقہ یہ ہے:

جب آپ مذکورہ بالا کارروائیوں میں سے کسی ایک کا انتخاب کرتے ہیں اگر یہ متعدد کالموں کو متاثر کرسکتا ہے تو وہ آپ سے پوچھے گا کہ کیا آپ صرف کالموں کے سب سیٹ یا ان سب کو متاثر کرنے کی اجازت دینا چاہتے ہیں؟ زیادہ تر معاملات میں آپ یہ چاہتے ہیں کہ یہ تمام کالموں کو متاثر کرے ، تاہم کچھ حالات میں کالموں کو متاثر کرنے کو محدود کرنا مفید ہے۔ مثال کے طور پر ، اگر آپ ایک سلسلہ منتخب کررہے ہیں لیبل اور قدریں، جو ویب صفحات میں پوزیشن کو تبدیل کرتا ہے آپ تمام لیبل اور قدر منتخب کرسکتے ہیں۔ پھر ڈیٹاسیٹ میں اس کو مطلوبہ لیبل تک محدود رکھنے کے لئے مساوی کارروائی کا استعمال کریں اور یہ بتائیں کہ صرف لیبل اور قدر کے کالم ہی متاثر ہونگے۔ اس بات کو یقینی بنائے گا کہ قطاریں حذف ہونے سے دوسرے کالم متاثر نہیں ہوں گے ، مکمل ہونے کے ل it لیبل کالم کو چھپانا مفید ہوگا۔

ایک بار جب آپ اپنی مرضی کے مطابق ہر چیز میں ترمیم کرلیں ، کلک کریں اگلے اور ، آپ کے سکریپ ہدایات کو کھرچنی میں شامل کیا جائے گا۔ اس کے بعد آپ کے پاس یہ اختیار ہے کہ اگر آپ چاہیں تو مزید سکریپ ہدایات کو شامل کریں۔

ایک ویب پیج میں ہیرا پھیری کرنا

ویب پیج کو کھرچنے سے پہلے ہیراپولیٹ کیا جاسکتا ہے ، کلک کرکے ، ٹائپ کرکے اور ڈراپ ڈاؤن سے اقدار کو منتخب کرکے۔ یہ یاد رکھنا ضروری ہے کہ اگرچہ اس سے ایک نیا ویب پیج سکریپ ہدایات کو لوڈ کرنے کا سبب بن سکتا ہے جب تک کہ تمام قابل اطلاق سکریپ ہدایات پر عمل درآمد نہیں ہوتا ہے۔

کسی ویب صفحہ میں ہیرا پھیری کے ل either یا تو منتخب کریں عنصر پر کلک کریں, ہوور عنصر, کتابچہ, ٹائپ کریں or ڈراپ ڈاؤن لسٹ ویلیو کو منتخب کریں اعمال اگر آپ کلیک ایکشن انجام دے رہے ہیں تو آپ ویب پیج پر موجود متعدد عناصر پر کلک کرسکتے ہیں۔ بصورت دیگر آپ کو ایک مناسب HTML عنصر کا انتخاب کرنا ہوگا ، مثال کے طور پر متن کو کسی بکس میں ٹائپ کرنا چاہئے۔ پھر کلک کریں اگلے. اس سے ایک آپشن باکس کھل جائے گا جو آپ کو ایکشن مکمل کرنے کی اجازت دیتا ہے۔ جب ٹائپنگ اور ٹائپ کرنے یا منتخب کرنے کے ل from اعداد و شمار کے ڈراپ سے انتخاب کرتے وقت بالترتیب منتخب کیا جانا چاہئے۔ اس کے علاوہ تینوں افعال کے ل the اختیارات یکساں ہیں۔

اگر آپ چاہتے ہیں کہ آپ ٹیمپلیٹ کا انتخاب کرسکتے ہو تو اس ایکشن پر عملدرآمد ہونا چاہئے اور کلک ایکشن کے لئے جو ٹیمپلیٹ لاگو ہوتا ہے ، ایک بار کلک ایکشن مکمل ہونے کے بعد۔ تاہم ، ایک کلک ایکشن پر ایک نیا سانچے تفویض کرنا جو ایک ہی صفحے پر ایک سے زیادہ کلکس انجام دیتا ہے ، یہ اچھا خیال نہیں ہے ، جیسے ان لائن پاپ اپ کھولنا یا چیزوں کو اسکرین پر ظاہر کرنا۔ اس کی وجہ یہ ہے کہ اگر کلک ایکشن صرف کچھ ٹیمپلیٹس پر ہی عملدرآمد کرتی ہے تو ، پہلے کلک کے ذریعہ تفویض کیا گیا نیا ٹیمپلیٹ دوبارہ ترتیب نہیں دیا جاسکتا ہے اور اس وجہ سے اس پر انحصار ہوتا ہے کہ اس اسکریپ کو کس طرح لکھا گیا تھا اسی صفحے پر آئندہ کلکس کو پھانسی دینے سے روک سکتے ہیں۔ آپ اس کی وضاحت بھی کرسکتے ہیں اگر آپ چاہتے ہیں کہ اس کارروائی کو صرف ایک بار عمل میں لایا جائے ، جو مفید ہے اگر آپ لاگ ان جیسے کچھ کر رہے ہیں intOA ویب سائٹ.

ٹائپ ٹیکسٹ یا سلیکٹ ڈراپ ڈاؤن لسٹ ویلیو اعمال آپ کو متعدد متن کے متعدد آئٹمز ٹائپ کرنے یا متعدد سلیکشن باکس سلیکشن کرنے کی اجازت دیتے ہیں۔ سکریپ ہدایات پر کلک کرکے ان میں ترمیم کی جاسکتی ہے متغیرات کو دیکھیں یا دیکھیں بٹن ، جیسا کہ اسکرین شاٹ میں بائیں طرف دکھایا گیا ہے۔

مثال کے طور پر اگر آپ تلاش کے خانے میں ناموں کی فہرست ٹائپ کرنا چاہتے ہیں تو یہ اہم ہوسکتا ہے۔ اس بات کو یقینی بنانے کے لئے کہ جب فارم میں کسی قدر کی قیمت تلاش کی جا is تب ہی اس کو جمع کیا جا each جب متن کو کامیابی کے ساتھ ٹائپ کیا جائے۔ into جب تک یہ ٹیمپلیٹ سیٹ نہ ہوجائے اس کے بٹن پر ٹیکسٹ باکس اور کلک ایکشن انجام نہیں دیا جاتا ہے۔ کلک ایکشن کے انجام دینے کے بعد ٹیمپلیٹ کو دوبارہ ترتیب دینے کے ل template ٹیمپلیٹ کو کسی اور چیز میں تبدیل کرنے کی ضرورت ہوگی۔

اعمال کے بعد جو ویب سائٹوں میں ہیرا پھیری کرتے ہیں ، اس کے بعد ، اگر یہ حرکتیں AJAX فعالیت کو شروع کردیتی ہیں تو ، تھوڑی دیر انتظار کرنا مفید ہے تاکہ AJAX کو سکریپ کے ساتھ جاری رکھنے سے پہلے لوڈ کرنے کی اجازت دی جا.۔ آپ اس میں تاخیر کا اضافہ کرکے کرسکتے ہیں پھانسی کے بعد انتظار کریں متن باکس.

ایک بار کچھ شرط پوری ہونے پر آپ سیدھے مختلف URL پر کودنا چاہتے ہیں۔ ایسا کرنے کے لئے یو آر ایل پر جائیں عمل ، جو اس وقت ظاہر ہوگا جب کم از کم ایک ٹیمپلیٹ کو سکریپ میں بیان کیا گیا ہو اور جب تخلیق کیا جائے تو اسے کسی ٹیمپلیٹ کو تفویض کرنا ہوگا ، تاکہ لامحدود چھلکوں سے بچنے میں مدد ملے۔

آخر میں آپ GrabzIt کی گرفتاری کے تمام API کو اپنے ویب اسکریپس میں استعمال کرسکتے ہیں ، صرف کیپچر ویب پیج ایکشن کا انتخاب کریں ، اور اپنی مطلوبہ گرفتاری کا انتخاب کریں۔ آپ اس کو منتخب کرکے ایک بار منتخب کرنے کے لئے کسی ٹیمپلیٹ کی وضاحت کرکے کھوٹ کے اندر کچھ مخصوص ویب صفحات کو گرفت میں لے سکتے ہیں اگلے بٹن پر کلک کرنا ہے۔

ہر سکریپ ہدایات کو شامل کرنے کے بعد اس کو کھرچنے والی ہدایات پینل میں دیکھا جاسکتا ہے ، ہر سکریپ ہدایت کے ساتھ موجود کراس سکریپ ہدایت کو حذف کرنے کی اجازت دیتا ہے۔ اگر کسی سکریپ ہدایت کو حذف کردیا جاتا ہے جس کی ضرورت دیگر کھرچنی ہدایات سے ہوتی ہے تو وہ ہدایات بھی حذف کردی جاتی ہیں۔ آپ کسی بھی کھرچنی ہدایات کو گرفت کے آئیکن کے ذریعہ گھسیٹ کر کھرچنا ہدایات کا حکم تبدیل کرسکتے ہیں۔

سکریپ ہدایات دستی طور پر تحریری

اگر آپ کو سکریپ ہدایات کو زیادہ مخصوص طریقے سے اپنی مرضی کے مطابق بنانے کی ضرورت ہے تو آپ کو سکریپ ہدایات کو دستی طور پر تبدیل کرنے کی ضرورت ہوگی۔

سکریپ ہدایات جاوا اسکرپٹ پر مبنی ہیں اور کوڈ ایڈیٹر نحو چیکر ، آٹو مکمل اور ٹول ٹپ کے ساتھ مکمل آتا ہے تاکہ اسے ہر ممکن حد تک آسان بنایا جاسکے۔

ویب سکریپر ہدایات کوڈ ایڈیٹر کی بنیادی فعالیت مینو کے اختیارات کے ذریعے قابل رسا ہے ، جیسا کہ اسکرین شاٹ میں دکھایا گیا ہے ، ہر ایک کا مقصد ذیل میں الگ سے بیان کیا گیا ہے۔ جب کہ آپ کے کھروں کی ہدایات میں کسی بھی نحوی غلطی کا اشارہ کوڈ ایڈیٹر کے بائیں ہاتھ کے گٹر میں ہوتا ہے۔

مددگار وزرڈ آپ کو اس صفحے کے کچھ حص selectے منتخب کرنے کی اجازت دیتا ہے جس کی آپ نچوڑ لینا چاہتے ہیں اور دوسرے عام کام جیسے ویب کیپچرز بنانا چاہتے ہیں۔

سکریپ ہدایات ڈسپلے کریں صارف کو سکریپ ہدایات کوڈ دکھاتا ہے۔

تمام ہدایات کو حذف کریں سکریپ کی تمام ہدایات کو حذف کردیتی ہے۔

ویب پیج افعال صفحہ مطلوبہ الفاظ درج کریں گے intاے کھرچنی ہدایات اور خودکار مکمل کھولیں ، جس میں ہر ممکنہ وسیلہ موجود ہے صفحہ افعال. صفحہ افعال آپ کو ویب صفحہ سے ڈیٹا نکالنے کی اجازت دیتے ہیں۔

ڈیٹا کام ڈیٹا کی ورڈ درج کریں گے intاے کھرچنی ہدایات ڈیٹا کام کرتا ہے آپ کی اجازت ہے save معلومات.

نیویگیشن افعال نیویگیشن مطلوبہ الفاظ میں داخل ہوتا ہے intاے کوڈ ایڈیٹر نیویگیشن افعال آپ کو یہ کنٹرول کرنے کی اجازت ہے کہ کس طرح ویب سکریپر ہدف کی ویب سائٹ پر گامزن ہے۔

عالمی کام عالمی مطلوبہ الفاظ میں داخل ہوتا ہے intاے کھرچنی ہدایات اس سے آپ کو رسائی مل جاتی ہے افعال جو مختلف ویب صفحات کی تجزیہ کے درمیان ڈیٹا کو محفوظ کرسکتا ہے۔ کھرچنی ہدایات لکھتے وقت یہ یاد رکھنا ضروری ہے کہ سکریپ ہدایات میں جاوا اسکرپٹ متغیر کی حالت اس وقت نہیں رکھی جاتی ہے جب کھرچنی ویب صفحات کے مابین حرکت پذیر ہوتی ہے ، جب تک کہ آپ عالمی سطح پر استعمال نہیں کرتے ہیں save متغیرات ، جیسا کہ ذیل میں دکھایا گیا ہے۔

Global.set("myvariable", "hello");
var mrvar = Global.get("myvariable");

جیسے کہ ذیل میں دکھایا گیا ہے ، Global.set کے طریقہ کار میں مستقل پیرامیٹر کو درست عالمی متغیر پاس بنانے کے ل. ،

Global.set("myvariable", "hello", true);

افادیت کے کام یوٹیلٹی کی ورڈ میں داخل ہوتا ہے intاے کھرچنی ہدایات یہ آپ کو استعمال کرنے کی اجازت دیتا ہے عام کام جو لکھنے کے سکریپ کو آسان بناتا ہے ، جیسے سوال شامل کرنا یا ہٹاناstring URLs کے پیرامیٹرز۔

کلیہ افعال معیار کے مطلوبہ الفاظ میں داخل ہوتا ہے intاے کھرچنی ہدایات یہ افعال آپ کو کھرچنے کے دوران نکالے گئے ڈیٹا کو بہتر بنانے کی اجازت دیتا ہے ، جیسے نقول کو ختم کرنا۔

فلٹر آپ کو آسانی سے فلٹر بنانے کی اجازت دیتا ہے ، اس کے لئے کچھ افعال کے ذریعہ ویب پیج میں سے کسی خاص HTML عنصر کو منتخب کرنا ہوتا ہے۔ آسانی سے وہ خصوصیات منتخب کریں جو آپ کے ہدف والے عنصر میں ہونی چاہئیں اور / یا عنصر کے والدین (زبانیں) کو اس عنصر کا انتخاب کرنا چاہئے۔ اس بات کو یقینی بنائیں کہ اس آپشن پر کلک کرنے سے پہلے آپ کا کرسر فلٹر کو بھی پاس کرنے کے لئے فنکشن میں صحیح جگہ پر موجود ہے۔

اسکرین شاٹ کام آپ کو اسکرین شاٹ کے اختیارات مرتب کرنے کی اجازت دیتا ہے۔ بس کرسر کو فنکشن کے صحیح حصے میں رکھیں ، جیسا کہ ٹول ٹائپ نے شناخت کیا ہے اور اسکرین شاٹ کے اختیارات کو دبائیں۔ پھر اپنی پسند کے تمام آپشنز کا انتخاب کریں اور کمانڈ داخل کریں۔

Strings

Stringایس کو اسکریپ ہدایات میں استعمال کیا جاتا ہے ، جب کسی ویب کی کھرچ کی نمائش کرتے ہوئے متن کی وضاحت کرنے کیلئے۔ A string ڈبل کے ذریعہ حد سے باہر ہے (") یا ایک حوالہ ('). اگر ایک string اس کی شروعات ایک ڈبل اقتباس کے ساتھ کی جانی چاہئے اس کا خاتمہ ڈبل قیمت کے ساتھ ہوگا ، اگر ایک string کسی ایک اقتباس سے شروع ہوتا ہے اس کا اختتام ایک اقتباس کے ساتھ ہونا چاہئے۔ مثال کے طور پر:

"my-class" اور 'my-class'

ایک عام خرابی جو ہوسکتی ہے وہ بند ہے string غلطی ، یہ ہے جب ایک string جیسا کہ اوپر دکھایا گیا ہے یا کوئی لکیر وقفہ ہے اس میں اختتامی قیمت نہیں ہے string. مندرجہ ذیل غیر قانونی ہیں strings:

"my
class"

"my class

اس غلطی کو دور کرنے کے لئے یہ یقینی بنانا ہے کہ ان میں لائن وقفے نہیں ہوں گے اور ان کے مماثل حوالہ جات ہوں ، جیسے:

"my class" اور "my class"

کبھی کبھی آپ چاہتے ہیں کہ ایک میں ایک ہی یا ڈبل ​​اقتباس پیش ہوں string. اس کا آسان ترین طریقہ یہ ہے کہ ایک میں ایک ہی اقتباس ڈالیں string ڈبل قیمت اور ایک میں ایک ڈبل اقتباس کے ساتھ محدود string ایک حوالہ کے ساتھ حد بندی کی ، جیسے:

"Bob's shop" اور '"The best store on the web"'

متبادل کے طور پر آپ اس طرح کے اقتباس سے بچنے کے لئے بیک سلیش استعمال کرسکتے ہیں:

'test\'s'

کامن دستی سکریپ ٹاسکس

لنک چیکر ایک کسٹم لنک چیکر بنائیں - ان آسان ہدایات پر عمل کرکے کسٹم کسٹم لنک چیکر بنانے کا طریقہ معلوم کریں۔
تصویری ڈاؤن لوڈ ایک ویب سائٹ سے تمام تصاویر ڈاؤن لوڈ کریں - پوری ویب سائٹ سے تمام تصاویر ڈاؤن لوڈ کرنے کا طریقہ معلوم کریں۔
ڈیٹاسیٹ بنائیں ڈیٹا نکالیں اور اسے تبدیل کریں intOA ڈیٹاسیٹ - اس ویب سائٹ سے ڈیٹاسیٹ بنانے کا طریقہ معلوم کریں جس کی آپ اسکریپنگ کررہے ہیں۔
لنک نکالیں کسی ویب سائٹ سے لنک نکالیں - پوری ویب سائٹ سے تمام HTML لنکس نکالنے کا طریقہ معلوم کریں اور save آپ کی خواہش کی شکل میں۔
متن منتخب کریں نمونوں کا استعمال کرتے ہوئے متن سے قدریں نکالنا - متن کے بلاکس سے قدریں نکالنے کے ل patterns نمونوں کا استعمال کس طرح کریں۔
OCR تصاویر سے متن نکالیں - تصاویر کے اندر موجود متن کو کیسے نکالنے کا طریقہ معلوم کریں۔
ڈیٹا بیس ڈیٹاسیٹ کو کیسے پیڈ کرنا ہے - بھرتی ڈیٹا کو استعمال کرکے اپنے نکلے ہوئے ڈیٹا کو بہتر شکل دیں۔
لڑی ارایوں سے جوڑ توڑ - یہ معلوم کریں کہ سکریپس کے اندر موجود صفوں کو آسانی سے ہینڈل کرنے کے لray خصوصی صف افادیت کے طریقے کس طرح استعمال کریں۔
عمل کھرچنا کے دوران صرف ایک بار کارروائی کریں - یہ معلوم کریں کہ پورے اسکریپ کے دوران صرف ایک بار کسی عمل کو کیسے انجام دیا جائے۔
تلاش کو بہتر سکریپڈ ڈیٹا کو بہتر بنانا - دریافت کریں کہ اپنے سکریپس سے غیر مطلوبہ ڈیٹا کو کیسے ختم کریں۔
ای میل اڈریس کسی ویب سائٹ کے ای میل پتوں کو کھرچنا - کسی ویب سائٹ سے تمام ای میل پتوں کو ختم کرنے کا طریقہ معلوم کریں۔
سکرین شاٹ اسکرین شاٹ پوری ویب سائٹ intاے پی ڈی ایف یا تصاویر - پوری ویب سائٹ کے ہر صفحے پر گرفت کے ل G GrabzIt کے ویب سکریپر کو استعمال کرنے کا طریقہ معلوم کریں۔
سکرین شاٹ غیر ساختہ متن سے تشکیل شدہ معلومات نکالیں - جذبات ، نام ، مقامات اور تنظیموں کو نکالنے کے لئے GrabzIt کا استعمال کریں۔

ایچ ٹی ایم ایل کے علاوہ دیگر مواد کو کھرچنا

جب ویب سکریپر PDF ، XML ، JSON اور RSS کے آر پار آتا ہے تو وہ اسے HTML کے قریب میں تبدیل کردیتا ہے ، جس سے ہمارے ویب کھرچنے والے کا صحیح انداز میں تجزیہ کرنے کی اجازت مل جاتی ہے اور آپ اس بات کا انتخاب کرسکتے ہیں کہ آپ کون سا مواد نکالنا چاہتے ہیں۔ مثال کے طور پر ، اگر آپ JSON ڈیٹا کو پارس کرنا چاہتے ہیں تو وہ ڈیٹا کو تبدیل کردے گا intجیسا کہ طرف دکھایا گیا ہے oa ہیرارچال HTML نمائندگی۔ اس سے آپ معمول کی طرح کھرچنی ہدایات تیار کرسکتے ہیں۔

اسی طرح جب کھرچنی ایک پی ڈی ایف دستاویز کو لوڈ کرتا ہے تو ، پی ڈی ایف میں تبدیل ہوجاتا ہے into HTML ، تصاویر ، ہائپر لنکس ، متن اور جدولوں کو منتخب کرنے اور سکریپ کرنے کی اجازت دینے کے لئے۔ تاہم ، چونکہ پی ڈی ایف کی کوئی اصل ڈھانچہ نہیں ہے ، لہٰذا ٹیبلز کی شناخت ہورسٹک کے ذریعے کی جاتی ہے اور ہمیشہ درست نہیں ہوتے ہیں۔

برآمدات کے اختیارات

یہ ٹیب آپ کو یہ منتخب کرنے کی اجازت دیتا ہے کہ آپ اپنے نتائج کو کس طرح برآمد کرنا چاہتے ہیں جیسے آپ کے اختیارات ایکسل اسپریڈشیٹ ، XML ، JSON ، CSV ، SQL کمانڈز ، یا HTML دستاویزات شامل ہیں۔ مزید برآں ، یہ ٹیب زپ سکریپ کے نتائج کا نام ترتیب دینے کی اجازت دیتا ہے۔ اگر آپ صرف فائلیں ڈاؤن لوڈ کررہے ہیں یا ویب کیپچرس تشکیل دے رہے ہیں تو پھر برآمدی آپشن کا انتخاب کرنے کی ضرورت نہیں ہے کیونکہ آپ کو نتائج پر مشتمل ایک زپ فائل ملے گی۔ یہ ٹیب آپ کو یہ بھی بتانے کی اجازت دیتا ہے کہ آپ نتائج کو کس طرح بھیجنا چاہتے ہیں۔ آپ اس کے ذریعہ نتائج بھیج سکتے ہیں ایمیزون S3, Dropbox، ای میل اطلاع ، FTP اور ویب ڈیو.

حتمی آپشن کال بیک یو آر ایل ہے ، جو سکریپ کے نتائج کو آپ کے استعمال میں لاگو کرکے ہمارے استعمال میں لاسکتی ہے سکریپ API.

زپ شدہ نتائج یا ہر ڈیٹا فائل کا فائل نام اگر آپ انہیں علیحدہ سے بھیجنے کی درخواست کرتے ہیں تو ڈیفالٹ فائل نام استعمال کریں کے اختیار کو غیر چیک کرکے اور آپ کا مطلوبہ فائل نام ترتیب دے کر مرتب کیا جاسکتا ہے۔ مزید برآں ، ٹائم اسٹیمپ ڈال کر آپ کے فائل نام میں شامل کیا جاسکتا ہے {GrabzIt_Timestamp_UTC+1} فائل نام میں. +1 UTC سے گھنٹوں میں آفسیٹ کو ظاہر کرتا ہے۔

آپ اسکریپ کے نتائج پر کلک کرکے بھی دیکھ سکتے ہیں نتائج دیکھیں بٹن ، کے پاس آپ کھرچنا، اس سے پچھلے 48 گھنٹوں میں ہونے والے کسی بھی اصل وقت کے اسکریپ نتائج کو دکھایا جائے گا۔

شیڈول کھرچنا

ویب سکریپ بناتے وقت شیڈول سکریپ ٹیب آپ کو یہ سیٹ کرنے کی اجازت دیتا ہے کہ آپ کب سکریپ شروع کرنا چاہتے ہیں اور اگر آپ اسے دہرانا چاہتے ہیں تو اسے کتنی بار کرنا چاہیے۔ جب کسی ویب صفحہ پر تبدیلی کا پتہ چلتا ہے تو سکریپ کو چلانے کے لیے بھی ترتیب دیا جا سکتا ہے۔ ایسا کرنے کے لئے ویب صفحہ تبدیل ہونے پر شروع کریں۔ چیک باکس، پھر نگرانی کے لیے ویب صفحہ کا یو آر ایل درج کریں۔ سی ایس ایس سلیکٹر صفحے کے اس حصے کا جو آپ ہیں۔ interested in. یہ ضروری ہے کہ صفحہ کے ایک چھوٹے سے حصے کو منتخب کیا جائے تاکہ غیر ضروری تبدیلیوں کی وجہ سے غلط مثبتات سے بچا جا سکے۔

نگرانی اور ڈیبگنگ سکریپس

ایک بار جب ویب کھرچنا شروع ہوجاتا ہے تو حیثیت کا آئکن اس میں بدل جائے گا اور کاروائی شدہ صفحات وقت کے ساتھ ساتھ بڑھنا شروع ہوجائیں گے۔ سکریپس کی پیشرفت کا اصل وقت کا اسنیپ شاٹ باقاعدگی سے ایک لاگ فائل کے ساتھ تیار کیا جاتا ہے جس کے ساتھ ہی آخری ویب صفحے کے باقاعدہ اسکرین شاٹ کو کھرچنا پڑا ہے۔ اس سے آپ کو یہ دیکھنے کی سہولت مل سکتی ہے کہ کھرچ کے دوران کیا ہو رہا ہے۔ اس معلومات کو تلاش کرنے کے ل your ، اپنے کھرچنی حصے کے ساتھ پھیلا ہوا آئیکون پر کلک کریں اور کلک کریں ناظر کھرچنا کے لئے intاس میں تفصیل لینا چاہ if اگر آپ کی کھرچنی ہدایات میں کوئی غلطی ہوئی ہو جیسے کوئی غلطی ہوئی ہو۔

ایک بار اسکریپ کامیابی کے ساتھ مکمل ہوجانے کے بعد اسٹیٹس کا آئیکن تبدیل ہوجائے گا ، اگر ناظرین کو کھول کر کوئی نتیجہ نہیں نکلا تو لاگ اور آخری اسکرین شاٹ آپ کو بتا سکتا ہے کہ کیا غلط ہوا ہے۔

نوشتہ جات میں اطلاع دی گئی سب سے عام پریشانی میں سے ایک یہ ہے کہ اس صفحے کو کھرچنے میں کافی حد تک تاخیر نہیں ہوتی ہے ، اکثر اس میں ایک چھوٹا سا اضافہ پیج لوڈ میں تاخیر میں پایا سکریپ کے اختیارات زیادہ تر ویب سائٹوں کے لئے ٹیب کافی ہے۔