پی ڈی ایف دستاویزات کے مواد سے اعداد و شمار کو کھرچنا اتنا لچکدار نہیں ہے جتنا HTML دستاویزات سے کرنا ایسا ہے لیکن ابھی بھی بہت سارے طریقوں کا استعمال کرتے ہوئے اسے حاصل کیا جاسکتا ہے GrabzIt ویب کھرچنی. سب سے پہلے پی ڈی ایف مواد کو کھرچنے کے لئے جس کا آپ استعمال کرتے ہیں PDF
کے بجائے کام کرتا ہے Page
افعال لیکن دوسری صورت میں افعال عام طور پر اسی طرح کام کرتے ہیں۔
کسی پی ڈی ایف دستاویز کے لئے فلٹر اس سے کہیں زیادہ آسان ہے کہ HTML دستاویز کے ل first سب سے پہلے آپ کو یہ بیان کرنا ہوگا کہ آپ کس قسم کا مواد نکالنا چاہتے ہیں: لنکس ، تصاویر یا متن۔
//Extract images PDF.getValue({"type":"image"}); //Extract links PDF.getValue({"type":"link"}); //Extract text PDF.getValue({"type":"text"});
لنکس اور تصاویر کے ل you آپ محدود کرسکتے ہیں کہ کونسی تصویر یا لنک کو اس کی پوزیشن کی وضاحت کرکے واپس کیا گیا ہے۔
PDF.getValue({"type":"image","position":"2"});
ایک دستاویز میں دوسری شبیہہ ملتی ہے۔ متن ، تصاویر اور روابط کے ل you آپ صفحہ نمبر کی وضاحت کرکے واپس آنے والے ڈیٹا کو مزید محدود کرسکتے ہیں۔
PDF.getValue({"type":"image","position":"2","page":"5"});
یہ پانچویں صفحے سے دوسری شبیہہ لوٹائے گا۔ متن لائن نمبر کے اضافی آپشن کے ساتھ آتا ہے ، تاہم متن پوزیشن کی حمایت نہیں کرتا ہے۔
PDF.getValue({"type":"text","page":"5","line":"10"});
اس کو پانچویں صفحے سے متن کی دسویں لائن ملتی ہے۔ ان فلٹر آپشن اختلافات کے علاوہ پی ڈی ایف دستاویزات سے ڈیٹا کو سکریپ کرنا بھی اسی طرح کام کرتا ہے ایچ ٹی ایم ایل دستاویزات سے ڈیٹا کھرچناتاہم ، کیوں کہ آپ اتنے مخصوص نہیں ہوسکتے ہیں کہ آپ کسی پی ڈی ایف فلٹر کے ذریعہ کیا نکال سکتے ہو جس کی آپ کو ضرورت ہے رحجان متن سے صحیح معلومات نکالنا۔