ایک نیوز: مائیکرو سافٹ نے مصنوعی ذہانت پر مبنی ایک اے آئی سافٹ ویئر بنایا ہے جو صرف تین سیکنڈ تک کسی کی بھی آواز سن کر اس کی ہوبہو نقل بناتا ہے۔ یہ سافٹ ویئر آواز کی کھرج، جذباتی لہجے اور اتار چڑھاؤ کی بھی نقل کرتا ہے۔
کمپیوٹر سافٹ ویئر بنانے والی امریکی کمپنی مائیکروسافٹ نے مصنوعی ذہانت کی مدد سے صرف تین سیکنڈ تک کسی شخص کی آواز سننے کے بعد ہوبہو نقل تیار کرنے کی صلاحیت رکھنے والا وائس سمولیٹر متعارف کیا ہے۔
اس وی اے ایل ایل ای لینگویج ماڈل کو بنانے کے لیے سات ہزار افراد کی انگریزی میں 60 ہزار گھنٹوں تقاریر استعمال کی گئیں تاکہ کسی بھی ان دیکھے شخص کی ’اعلیٰ معیار کی تقریر‘ کی ترکیب بنائی جا سکے۔
مصنوعی ذہانت کے اس سسٹم میں جب کسی شخص کی صرف ایک بار کی وائس ریکارڈنگ ہو، تو یہ سسٹم اس شخص کی طرح کچھ بھی کہنے کی آواز نکال سکتا ہے۔ حتیٰ کہ یہ بولنے والے کے جذباتی لہجے اور صوتی ماحول کی بھی نقل کر سکتا ہے۔
اس سسٹم کی وضاحت کرنے والے ایک پیپر کے مطابق ’تجربے کے نتائج سے پتہ چلتا ہے کہ وی اے ایل ایل-ای نے تقریر کے فطری ہونے اور بولنے والے کے ساتھ مماثلت کے لحاظ سے جدید ترین زیرو شاٹ ٹیکسٹ ٹو سپیچ سنتھیسس(ٹی ٹی ایس) سسٹم کو پیچھے چھوڑ دیا ہے۔
ویڈیوز میں کسی شخص کی بصری مماثلت کی نقل کرنے والی ڈیپ فیک ٹیکنالوجی کی طرح اس کے بھی غلط استعمال کا امکان موجود ہے۔
مائیکروسافٹ نے کہا کہ وہ وی اے ایل ایل ای میں بہتری لانے کے ساتھ ساتھ اپنے مصنوعی ذہانت کے اصولوں پر بھی عمل کرے گی۔ نیز اس طرح کے خطرات کو کم کرنے کے لیے سنتھیسس آواز کا پتہ لگانے کے ممکنہ طریقوں پر بھی غور کیا جائے گا۔