ویب پر گرفت اور تبدیل کرنے کے اوزار

غیر ساختہ متن سے ساختہ معلومات خود بخود کیسے نکالیں؟

عمومی تحریری متن میں بہت سی معلومات شامل ہوسکتی ہیں جو آسانی سے نہیں نکال پاتی ہیں۔ مثال کے طور پر ایک جملہ شاید کسی کمپنی کے بارے میں جائزہ لے لیکن آپ کیسے جانتے ہو کہ یہ اچھا ہے یا برا جائزہ؟

ایک عام ویب کھرچنی اس معلومات کو نہیں نکال پائے گی۔ تاہم GrabzIt اس کو استعمال کرکے قدرتی زبان کی پروسیسنگ کی صلاحیتوں میں بنا سکتا ہے۔ جیسا کہ ذیل کی مثال میں دکھایا گیا ہے ، صفحہ متن کا تجزیہ کیا گیا ہے اور مندرجہ ذیل اقدار میں سے ایک بہت ہی منفی ، منفی ، غیر جانبدار ، مثبت اور بہت مثبت ہے۔

Data.save(Utility.Text.extractSentiment(Page.getText()), 'Dataset', 'Sentiment');

اگرچہ GrabzIt ویب کھرچنی زبان کا پتہ لگانے ، مقامات کے نام ، لوگوں کے نام اور تنظیموں کے نام سمیت متن سے بہت کچھ نکال سکتا ہے۔ جن کی مثالوں کے نیچے دکھایا گیا ہے۔

//Language Detection
Data.save(Utility.Text.extractLanguageName(Page.getText()), 'Dataset', 'Language');
//Identify Geographic Locations
Data.save(Utility.Text.extractLocations(Page.getText()), 'Dataset', 'Locations');
//Identify People's Names
Data.save(Utility.Text.extractNames(Page.getText()), 'Dataset', 'Names');
//Identify Organizations Names
Data.save(Utility.Text.extractOrganizations(Page.getText()), 'Dataset', 'Organizations');

آپ کو ان میں سے کسی بھی کھرچنی ہدایات کو خود لکھنے کی ضرورت نہیں ہے ، کیونکہ جب آپ ہمارے سکریپر وزرڈ میں کسی قابل اطلاق HTML عنصر کو منتخب کریں گے تو وہ خود بخود ظاہر ہوں گی۔