రిలేషన్ ఎక్స్‌ట్రాక్షన్ (ఎన్‌ఎల్‌పి) లో, పర్యవేక్షించబడిన, సెమీ పర్యవేక్షించబడిన మరియు పర్యవేక్షించబడని రిలేషన్ వెలికితీత మధ్య తేడా ఏమిటి?


సమాధానం 1:

పర్యవేక్షించబడిన అభ్యాసంలో, అభ్యాసకుడికి అవసరమైన ప్రతిదాన్ని కలిగి ఉన్న పెద్ద డేటా సెట్ ఉంది. పదాలు మరియు మీకు కావలసిన వచనం మధ్య ఉన్న అన్ని సంబంధాలతో ఇది పత్రాలను కలిగి ఉంది. కనిపించని పత్రాలపై ఈ పనిని ఎలా చేయాలో అభ్యాసకుడు నేర్చుకోవాలి.

సెమీ పర్యవేక్షించబడిన అభ్యాసంలో, మీకు పెద్ద సంఖ్యలో పత్రాలు ఉన్నాయి మరియు వీటిలో చిన్న ఉపసమితి కోసం, మీకు మొత్తం డేటా ఉంది.

పర్యవేక్షించబడని అభ్యాసంలో, అభ్యాసకుడికి పత్రాలు మాత్రమే ఉన్నాయి. ఇది డేటాను వివరించే ఆసక్తికరమైన నమూనాల కోసం చూడవచ్చు. ఈ నమూనాలు అర్ధవంతమైనవి కావచ్చు, కానీ అవి యాదృచ్ఛిక కళాఖండాలు కూడా కావచ్చు. తగినంత డేటా ఉన్నప్పుడు, అర్ధవంతమైన నమూనాలను గుర్తించడం సులభం అవుతుంది. అయితే, నమూనాలను చూసే సూపర్‌వైజర్ లేకుండా, అల్గోరిథం దానికి ఎటువంటి అర్ధాన్ని ఇవ్వదు. ఉదాహరణకు, 'ప్రెసిడెంట్', 'ఒబామా' మరియు 'బరాక్' అనే పదాలు తరచూ కలిసి సంభవిస్తాయని లేదా మరొకటి కూడా సాధారణంగా కనిపించే పరిస్థితులలో ఒకటి సంభవిస్తుందని కనుగొనవచ్చు (అవి పర్యాయపదాలు కావచ్చు అనే సూచిక). సాధారణంగా ఇది ఒక వ్యక్తిని వివరిస్తుందని కనుగొనలేరు.