ویب پر گرفت اور تبدیل کرنے کے اوزار

پی ڈی ایف دستاویزات سے ڈیٹا نکالنا

پی ڈی ایف دستاویزات کے مواد سے اعداد و شمار کو کھرچنا اتنا لچکدار نہیں ہے جتنا HTML دستاویزات سے کرنا ایسا ہے لیکن ابھی بھی بہت سارے طریقوں کا استعمال کرتے ہوئے اسے حاصل کیا جاسکتا ہے GrabzIt ویب کھرچنی. سب سے پہلے پی ڈی ایف مواد کو کھرچنے کے لئے جس کا آپ استعمال کرتے ہیں PDF کے بجائے کام کرتا ہے Page افعال لیکن دوسری صورت میں افعال عام طور پر اسی طرح کام کرتے ہیں۔

کسی پی ڈی ایف دستاویز کے لئے فلٹر اس سے کہیں زیادہ آسان ہے کہ HTML دستاویز کے ل first سب سے پہلے آپ کو یہ بیان کرنا ہوگا کہ آپ کس قسم کا مواد نکالنا چاہتے ہیں: لنکس ، تصاویر یا متن۔

//Extract images
PDF.getValue({"type":"image"});
//Extract links
PDF.getValue({"type":"link"});
//Extract text
PDF.getValue({"type":"text"});

لنکس اور تصاویر کے ل you آپ محدود کرسکتے ہیں کہ کونسی تصویر یا لنک کو اس کی پوزیشن کی وضاحت کرکے واپس کیا گیا ہے۔

PDF.getValue({"type":"image","position":"2"});

ایک دستاویز میں دوسری شبیہہ ملتی ہے۔ متن ، تصاویر اور روابط کے ل you آپ صفحہ نمبر کی وضاحت کرکے واپس آنے والے ڈیٹا کو مزید محدود کرسکتے ہیں۔

PDF.getValue({"type":"image","position":"2","page":"5"});

یہ پانچویں صفحے سے دوسری شبیہہ لوٹائے گا۔ متن لائن نمبر کے اضافی آپشن کے ساتھ آتا ہے ، تاہم متن پوزیشن کی حمایت نہیں کرتا ہے۔

PDF.getValue({"type":"text","page":"5","line":"10"});

اس کو پانچویں صفحے سے متن کی دسویں لائن ملتی ہے۔ ان فلٹر آپشن اختلافات کے علاوہ پی ڈی ایف دستاویزات سے ڈیٹا کو سکریپ کرنا بھی اسی طرح کام کرتا ہے ایچ ٹی ایم ایل دستاویزات سے ڈیٹا کھرچناتاہم ، کیوں کہ آپ اتنے مخصوص نہیں ہوسکتے ہیں کہ آپ کسی پی ڈی ایف فلٹر کے ذریعہ کیا نکال سکتے ہو جس کی آپ کو ضرورت ہے رحجان متن سے صحیح معلومات نکالنا۔