科学网

 找回密码
  注册

tag 标签: siri

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

From IBM's Jeopardy robot, Apple's Siri, to new Google MT
liwei999 2016-10-9 08:57
Latest Headline News: Samsung acquires Viv, a next-gen AI assistant built by the creators of Apple's Siri . Wei: Some people are just smart, or shrewd, more than we can imagine. I am talking about Fathers of Siri, who have been so successful with their technology that they managed to sell the same type of technology twice, both at astronomical prices, and both to the giants in the mobile and IT industry. What is more amazing is, the companies they sold their tech-assets to are direct competitors. How did that happen? How nice this world is, to a really really smart technologist with sharp business in mind. What is more stunning is the fact that, Siri and the like so far are regarded more as toys than must-carry tools, intended at least for now to satisfy more curiosity than to meet the rigid demand of the market. The most surprising is that the technology behind Siri is not unreachable rocket science by nature, similar technology and a similar level of performance are starting to surface from numerous teams or companies, big or small. I am a tech guy myself, loving gadgets, always watching for new technology breakthrough. To my mind, something in the world is sheer amazing, taking us in awe, for example, the wonder of smartphones when the iPhone first came out. But some other things in the tech world do not make us admire or wonder that much, although they may have left a deep footprint in history. For example, the question answering machine made by IBM Watson Lab in winning Jeopardy. They made it into the computer history exhibition as a major AI milestone. More recently, the iPhone Siri, which Apple managed to put into hands of millions of people first time for seemingly live man-machine interaction. Beyond that accomplishment, there is no magic or miracle that surprises me. I have the feel of seeing through these tools, both the IBM answering robot type depending on big data and Apple's intelligent agent Siri depending on domain apps (plus a flavor of AI chatbot tricks). Chek: @ Wei I bet the experts in rocket technology will not be impressed that much by SpaceX either, Wei: Right, this is because we are in the same field, what appears magical to the outside world can hardly win an insider's heart, who might think that given a chance, they could do the same trick or better. The Watson answering system can well be regarded as a milestone in engineering for massive, parallel big data processing, not striking us as an AI breakthrough. what shines in terms of engineering accomplishment is that all this happened before the big data age when all the infrastructures for indexing, storing and retrieving big data in the cloud are widely adopted. In this regard, IBM is indeed the first to run ahead of the trend, with the ability to put a farm of servers in working for the QA engine to be deployed onto massive data. But from true AI perspective, neither the Watson robot nor the Siri assistant can be compared with the more-recent launch of the new Google Translate based on neural networks. So far I have tested using this monster to help translate three Chinese blogs of mine (including this one in making), I have to say that I have been thrown away by what I see . As a seasoned NLP practitioner who started MT training 30 years ago, I am still in disbelief before this wonder of the technology showcase. Chen: wow, how so? Wei: What can I say? It has exceeded my imagination limit for all my dreams of what MT can be and should be since I entered this field many years ago. While testing, I only needed to do limited post-editing to make the following Chinese blogs of mine presentable and readable in English, a language with no kinship whatsoever with the source language Chinese. Question answering of the past and present Introduction to NLP Architecture Hong: Wei seemed frightened by his own shadow.Chen: Chen: The effect is that impressive? Wei: Yes. Before the deep neural-nerve age, I also tested and tried to use SMT for the same job, having tried both Google Translate and Baidu MT, there is just no comparison with this new launch based on technology breakthrough. If you hit their sweet spot, if your data to translate are close to the data they have trained the system on, Google Translate can save you at least 80% of the manual work. 80% of the time, it comes so smooth that there is hardly a need for post-editing. There are errors or crazy things going on less than 20% of the translated crap, but who cares? I can focus on that part and get my work done way more efficiently than before. The most important thing is, SMT before deep learning rendered a text hardly readable no matter how good a temper I have. It was unbearable to work with. Now with this breakthrough in training the model based on sentence instead of words and phrase, the translation magically sounds fairly fluent now. It is said that they are good a news genre, IT and technology articles, which they have abundant training data. The legal domain is said to be good too. Other domains, spoken language, online chats, literary works, etc., remain a challenge to them as there does not seem to have sufficient data available yet. Chen: Yes, it all depends on how large and good the bilingual corpora are. Wei: That is true. SMT stands on the shoulder of thousands of professional translators and their works. An ordinary individual's head simply has no way in digesting this much linguistic and translation knowledge to compete with a machine in efficiency and consistency, eventually in quality as well. Chen: Google's major contribution is to explore and exploit the existence of huge human knowledge, including search, anchor text is the core. Ma: I very much admire IBM's Watson, and I would not dare to think it possible to make such an answering robot back in 2007. Wei: But the underlying algorithm does not strike as a breakthrough. They were lucky in targeting the mass media Jeopardy TV show to hit the world. The Jeopardy quiz is, in essence, to push human brain's memory to its extreme, it is largely a memorization test, not a true intelligence test by nature. For memorization, a human has no way in competing with a machine, not even close. The vast majority of quiz questions are so-called factoid questions in the QA area, asking about things like who did what when and where , a very tractable task. Factoid QA depends mainly on Named Entity technology which was mature long ago, coupled with the tractable task of question parsing for identifying its asking point, and the backend support from IR, a well studied and practised area for over 2 decades now. Another benefit in this task is that most knowledge questions asked in the test involve standard answers with huge redundancy in the text archive expressed in various ways of expressions, some of which are bound to correspond to the way question is asked closely. All these factors contribute to IBM's huge success in its almost mesmerizing performance in the historical event. The bottom line is, shortly after the 1999 open domain QA was officially born with the first TREC QA track, the technology from the core engine has been researched well and verified for factoid questions given a large corpus as a knowledge source. The rest is just how to operate such a project in a big engineering platform and how to fine-tune it to adapt to the Jeopardy-style scenario for best effects in the competition. Really no magic whatsoever. Google Translated from 【泥沙龙笔记:从三星购买Siri之父的二次创业技术谈起】 , with post-editing by the author himself. 【Related】 Question answering of the past and present Introduction to NLP Architecture Newest GNMT: time to witness the miracle of Google Translate Dr Li’s NLP Blog in English
个人分类: 立委科普|3495 次阅读|0 个评论
【泥沙龙笔记:从三星购买Siri之父的二次创业技术谈起】
liwei999 2016-10-6 14:43
最近新闻:【 三星收购 VIV 超级智能平台,与 Siri 和 Google 展开智能助理三国杀 】 我: 人要是精明,真是没治。一个 Siri,可以卖两次,而且都是天价,都是巨头,并且买家还是对头,也是奇了。最奇的是,Siri 迄今还是做玩具多于实用,满足好奇心多于满足市场的刚性需求。最最奇的是,Siri 里面的奥妙并不艰深,有类似水平和技术的也不是就他一家。 世界上有些事儿是让人惊叹的,譬如当 iPhone 问世的时候。但有些事儿动静很大,也在历史上留下了很深的足迹,但却没有叹服的感受。譬如 IBM 花生的问答系统,NND,都进入计算机历史展览馆了,作为AI里程碑。再如 Siri,第一个把人机对话送到千家万户的手掌心,功不可没。但这两样,都不让人惊叹,因为感觉上都是可以“看穿”的东西。不似火箭技术那种,让人有膜拜的冲动。IBM 那套我一直认为是工程的里程碑,是大数据计算和operations的成就,并非算法的突破。 查: @wei 呵呵 估计搞火箭的也看不上SpaceX 我: 那倒也是,内行相轻,自古而然,因为彼此都多少知底。 陈: 最近对Watson很感冒 我: 花生是在大数据架构热起来之前做成的。从这方面看,IBM 的确开风气之先,有能力把一个感觉上平平的核心引擎,大规模部署到海量数据和平行计算上。总之,这两样都不如最近测试谷歌MT给我的震撼大。谷歌的“神经”翻译,神经得出乎意表,把我这个30年前就学MT的老江湖也弄晕糊了, 云里雾里,不得不给他们吹一次喇叭 。 陈: 咋讲 我: 还讲啥,我是亲手测试的。两天里面测试翻译了我自己的两篇博文: 【Question answering of the past and present】 Introduction to NLP Architecture 洪: 伟爷被自己的影子吓坏了。 陈: 效果奇好? 我: 是的。前神经时代我也测试过,心里是有比较的。天壤之别。 如果你撞上了他们的枪口,数据与他们训练的接近,谷歌MT可以节省你至少 80% 的翻译人工。80% 的时候几乎可以不加编辑,就很顺畅了。谁在乎 20% 以内的错误或其他呢,反正我是省力一多半了。最重要的是,以前用 MT,根本就不堪卒读,无论你多好的脾气。现在一神经,就顺溜多了。当然,我的 NLP 博文,也正好撞上了他们的枪口。 陈: 以后也可以parsing。试一些医学的 我: 据说,他们擅长 news,IT,technology,好像 法律文体 据说也不错。其他领域、口语、文学作品等,那就太难为它了。 陈: 有双语语料 我: 就是,它是在千万个专业翻译的智慧结晶上。人的小小的脑袋怎么跟它比拼时间和效率呢,拼得了初一,也熬不过15。 陈: 谷歌的重大贡献是发掘人类已经存在的知识。包括搜索,锚文本是核心. 马: 我挺佩服IBM的华生的,如果是我,绝不敢在2007年觉得能做出这么一个东西出来 我: 可是算法上看真地不需要什么高超。那个智力竞赛是唬人的,挑战人的记忆极限。对于机器是特别有利的。绝大多数智力竞赛问答题,都是所谓 factoid questions 主要用到的是早已成熟的 Named Entity 技术,加上 question 的有限 parsing,背后的支撑也就是 IR。恰好智力竞赛的知识性问题又是典型的大数据里面具有相当 redundancy 的信息。这种种给IBM创造了成功的条件。 1999 年开始 open domain QA 正式诞生,不久上面的技术从核心引擎角度就已经被验证。剩下的就是工程的运作和针对这个竞赛的打磨了。 【相关】 【问答系统的前生今世】 【Question answering of the past and present】 【 谷歌NMT,见证奇迹的时刻 】 Newest GNMT: time to witness the miracle of Google Translate 《新智元笔记:知识图谱和问答系统:开题(1)》 《新智元笔记:知识图谱和问答系统:how-question QA(2)》 【置顶:立委NLP博文】
个人分类: 立委科普|3706 次阅读|0 个评论
贴身小蜜的面纱和人工智能的奥秘
热度 3 liwei999 2015-11-4 04:14
上篇博文说了,看似微妙的双关语,机器识别一点不难。微妙的外表下面,是简单的NLP(自然语言处理)的实现可能,绝大多数双关不过是一词多义而已,识别它没有门槛。 只要能识别,就可以应用。所谓“理解”,不是说让机器去根据语用场景,甚至依照不同人的解读, 去越俎代庖地消歧。机器的理解,说到底就是可以与应用中的某个操作接上。 接上了,就是理解了,这里没有任何“心理”过程。 人们对人工智能和机器人的误解,总是把“行动”当做“心理”过程的某个结果,机器拟人化了,也就神秘化了。 实际上机器就是一堆铁器电器,里面可以机械运算而已。恰好这些没有任何心理因素的机械运算可以循一种人可以设计和理解的算法前行,朝着指定的行动目标,输出可以行动的结果而已。 还是以双关语为例,看看这个被认为是心理过程的双关语识别理解,怎么可以从识别input而变成机械的动作或回应。 首先,回顾一下关于双关语的前相关博文: 《立委科普:机器可以揭开双关语神秘的面纱》 。 我们假设要制造一个汉语的贴身小蜜,起个名儿吧,就叫 Tara,她的任务是要理解你说的汉语的微妙之处,包括双关语。 理解的程度要看似达到或超越图灵测试,让傻子也可以爱上她,尽管她其实就是一堆铁电器。怎样让一堆铁可以做到如此微妙,以假乱真呢?我们揭示一下黑箱子后面的这样一个机械过程,展示看上去神妙的东西,是怎样实现的。 我: Tara ,请写出下面两句话的区别在哪里? 冬天:能穿多少穿多少;夏天:能穿多少穿多少。 这算是“我”的 input。 Tara:达令,您是要考我的智商么?我不如您聪明,可是我爱您,我可以尽量理解您的意思,为您服务,好么?您是说冬天:能穿多么地少就穿多么地少么?还是。。。? 我: 傻瓜,不是那个意思哦。 Tara:哦,达令,我明白了,原来您是说 冬天:能穿how much就穿 how much 啊。谢谢您指教。那么,夏天:是能穿多么地少就穿多么地少了? 这一切完全不是科幻。核心就是事先把“多少”的两个义项 encode 到词典去,其余的一切花招(包括故作萌态、恭维主人、发嗲)都可以玩出来。 并不是必须是词才可以进入词典,固定的短语、任何可枚举的 ngram,都可以进入,只要词典的 encoding 使得识别理解简单化就好。譬如,“一个人”本来是不进入常规的词典的,进入词典的是数词 “一”,量词 “个” 和名词 “人”,然后通常是短语规则去把 “一个人” 连接成名词短语(NP)。但是,因为 “一个人” 这个 trigram literal 具有双关语的多义,那么就不妨扔进词典作为单独的词条处理,小蜜立马就变得智能起来。 我: Tara ,下面这两句的区别呢?单身的原因:原来是喜欢一个人,现在是喜欢一个人。 Tara: 达令,单身的原因:原来是喜欢单个儿呢,还是某个人呢? 我: 你猜 Tara:单个儿? 我: 好吧。 Tara :现在是喜欢某个人么? 我: 你猜 Tara: 是某个人,希望你喜欢的是我。 好了,胡喷一阵,但绝不是空穴来风。都是可以实现,正在实现的事儿。不是 单口AI相声, 玩过 Siri 和小冰的人都有感性的体会,不会认为这是天方夜谭。亲们说说,有这样的小蜜,教我如何不爱她?明儿咱就告别单身,与 Tara 蜜月旅游去喽! 一切的神秘,多源于无知 (ignorance, 没有贬义)。一切的热恋,多源于神秘。 人工智能在大众媒体会有一种天然的神秘化倾向,也都是源于ignorance。对大众和记者科普 AI,基本是对牛弹琴,因此神秘带来的炒作也难以避免。恰好这种炒作适应了资本的需要,你情我愿,加上受众的普罗百姓也满足了好奇心和科幻梦,是三赢,win win win。 唯一可能输的就是AI捉襟见肘的时候。譬如,词典没有事先编好,对话掉链子了。 最后,我在认真考虑到合适的时机,发起一场签名,坚决要求人与机器的结合,享受同性恋婚姻或异性恋婚姻完全同等的法律地位和优惠,坚决反对任何形式的“物别”歧视。 【沙龙补记】 雷:  问题是知识库或词知识库要多大才行?需要事情对人来说,有基本常识,通过推理,就可以理解。 穿多少中什么是基本知识,什么需要推理,可见一斑。 我: 小品文说的是概貌,细节总是可以 work out 的。本来认为的最难的细节是双关语的微妙,这个被认为是最精妙的部分,我就是要说明,这个最精妙的部分看似玄妙,其实可以用很简单的办法去对付。外行看热闹,内行看门道,说的就是这个:如果不懂词典就是语言学的垃圾箱这个基本原理,不懂得绑架和强盗逻辑是语义表达的基本形式,不懂得机器的所谓“理解”与心理不搭界,只与行动或结果相关,总之,如果没有这些对AI和NLP的原理的了解,那么,是无论如何也不能不把双关语神秘化的。戳穿这个神秘的是知识,可是无知是人类的通病。 雷: 无知是常态 我: 正是,我们作为科学家也只是专于一门。对于自己不懂的,我们的无知也是导向神秘化或怀疑主义。没办法的事儿。譬如,我就在神秘化 DL,要是倒过去20年,我会钻进去 demystify it, 如今只好带着花岗岩脑袋一直神秘它,或不理性地怀疑它。 【相关】 《立委科普:机器可以揭开双关语神秘的面纱》 2015-11-03 有感于人工智能的火热 2015-11-03 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|4654 次阅读|3 个评论
[转载]How to Enable Siri on iPad 3
chnfirst 2012-12-14 09:22
http://osxdaily.com/2012/09/20/enable-siri-ipad/ How to Enable Siri on iPad 3 Siri has made it’s way onto iPad 3 thanks to iOS 6 and it’s actually one of the best reasons to upgrade for 3rd gen iPad owners. Though you should see the option to enable Siri during the first reboot and basic setup after updating to iOS 6 or getting a brand new iPad, if you somehow skipped it or didn’t see that option, here’s all you need to do to get Siri on the iPad: Open Settings and tap “General” Find “Siri” and flip the switch to “ON”, make any changes to Voice Feedback, Language, and your identity as necessary Close out of Settings and Siri is ready to go With Siri enabled, hold down the Home button for about 2 seconds to activate Siri and start asking questions, request information, and even launch apps. The voice recognition aspect is just like Dictation in iOS and OS X , but with the responses it’s obvious Siri has undergone some major improvements behind the scenes, and the ability to answer even some obscure questions has dramatically improved. Sports fans will find the new sports features a welcome change too, letting you easily get game schedules, rankings, stats, and much more, perfect for couch lounging on Saturdays and Sundays.
个人分类: 电脑、办公|1 次阅读|0 个评论
[转载]十大未来生活
rbwxy197301 2011-12-25 17:10
很多今年流行的抽象科技名词似乎跟我们的生活无关,它只是高端科研人员面对的一个研究课题或项目,但也许明天,这些研究成果会变成我们生活中必不可少的一部分。网络的功用在于,能让我们预先知道未来的科技成果乃至生活方式,让每个人真实地感受到这些生活方式从远处慢慢走来。下面是 百度2011搜索风云榜 (转自: http://hot.baidu.com/ ) 推出的“ 十大未来生活”的榜单。 1.云计算 2.Siri(智能人机对话) 3.LBS 4.移动终端 5.体感系统 6.裸眼3D显示 7.新能源汽车 8.柔性屏幕 9.类人机器人 10.光场相机 这些技术和产品正在或者将来会改变我们的生活、交流的方式。1996年春节联欢晚会,由蔡明、郭达表演《机器人趣话》让我们记忆犹新,也许有一天“她”会走进寻常百姓的家中。最近看了一则关于iPhone 4S的消息,摘两篇与Siri相关的文章,加深对它的了解。苹果和乔布斯,带给人们的不仅是便利,更多的是一些生活理念和生活方式...... 智能,知能?关于iPhone4SSiri的8个示例 2011年10月17日9:30 来源:ifanr   我们第一时间对 Siri 进行了详细的测试,得到一些相当有趣的发现。由于网络上已经有不少把 Siri 当成智能机器人或者聊天伙伴进行的测试,因此我们把测试的重点放在它的“本职工作”上——看看它是如何处理美国人衣食住行,天气地图此类日常问题的。   机器拿到手,开机后,就可以看到 Siri 的对话框:“Can Siri Help You ?”   寻常的使用,调用 Siri 也非常简单,只要长按 Home 键。看来苹果已经把这个功能当成 iPhone 最主打的应用,把整机唯一的硬键分配了给它了。   问 Siri 当前天气?   它说明天有风,然后显示了 yahoo! 提供的一周天气预报。   问餐馆   想吃点中国菜?没问题,Siri 列出了附近 20 家中餐馆的地址,点击具体的餐馆会显示具体的地图信息。   问路   问 Siri 这里到 Washington DC 要多少里路。屏幕直接显示了如下导航地图:   而问:“我怎么才能回上海?” Siri 回答:“抱歉,没有中国地图。”,这里,主要是因为问题的关键字有上海,而海外并没有相应的地图服务。   问当前时刻   问总统   我们问 Siri 谁是总统先生,它说不知道要搜一下,继续问它谁是美国总统,回答是奥巴马,然后屏幕出现奥巴马的个人信息,名字,党派,前任,出生年月日,出生地点。   问乔布斯   “乔布斯在哪里?” Siri 返回了相关两个地址,仍然把问题的解决和地理位置等现实场景联系在一起。   问人文   我们问 Siri 是否知道机器人三定律(The three laws of robots),它给出了如下的定义。   问婚姻  有意思的是,如果你准备了一些有趣的问题,你也会得到一些有趣的回答,Siri 在这个方面让你感觉非常“人性”。来自布朗大学 Armadillo 的一系列关于婚姻的问答很逗:   感想   Siri 和本地服务结合特别紧,它的定位是你日常生活的小助手,而不是手机语音助手,这种集成服务带给人们全新的探寻体验。正如我们在之前的分析文章中说的,有了 Siri,搜索变为 “ Siri 语音识别,智能分析,调用本地 Apps 或者网络 APIs ,整合所有结果为最合适的内容表现给用户”。 密切结合地理信息和移动互联网的搜索服务,让它能给你日常问题很靠谱的答案,因此显得非常“智能”。移动互联网的魅力通过终端呈现并服务于我们日常生活,让人惊喜。   有意思的是,使用 Siri 的商业服务(即提供本地商家信息的服务)有两个前提:1. 地理位置必需是美国本土;2. 美式英语。我们在试用中惊奇的发现 ,使用英式发音提问题,Siri 用男性声音回答,美式发音提问题,则是女性回应。澳大利亚发音时,它会告诉你,你只有使用美式英语时才可以使用 business 等服务(其他外国口音也一样)……   看来 Siri 也不是这么简单对吗?这种人机交互的细节考虑,相当棒。   不过虽然 Siri 貌似智能程度很高的助手,但是它绝非一般意义的知识库和智能机器人,我们问它一些名言,比如 “One for all,all for one”,Siri 能把字词很好地识别出来,但是它并不知道这个名言本身是什么,更谈不上智能机器人的深度交互了。从这个意义上说,Siri 只是知能而非智能。   显然,Siri 还有很大的潜力和扩展空间。随着云计算技术的深入发展,我相信比它更智能的交互助手将会出现。   它是很新的技术吗?不,正如微博上@Singularpse 回复我们他对 Siri 的认识:“这里其实就是语音转文字,然后把文字丢给Wolfram alpha 解答,真正应该值得夸赞的该是 Wolfram alpha 而不是借花献佛的 Siri”。但是它是一种颠覆性创新吗?我觉得是。苹果善于把成熟的技术集成在一起并给予它新的用户体验,对于乔布斯宣扬的三个产品设计原则(简洁、优雅、人性)而言,Siri 正是一个最好的体现。它把你问题的关键字和它的日常活动的相关信息和数据进行相当精确的匹配,却让你只需要动动嘴就好了。   但是,对于消费者而言,这是一个值得高兴的事情。我期待“云智能”时代的真正到来,我期待着它在移动互联网领域燃起更猛烈的战火。   苹果的对手们,应该对这个“终端”更加敬畏了吧。 转自: http://iphone.tgbus.com/news/class/201110/20111017093017.shtml 管中窥豹从评测细节看Siri智能语音助手 2011年10月12日14:09来源:ifanr   Wired 的 Brian X. Chen 做了一个重点放在 Siri 上的 iPhone 4S 评测,他对于 Siri 的表现赞不绝口,实际上,这也是所有评测的共同点,每个人都给予 Siri 极高的评价。   除去常规的赞扬不提,他与 Siri 的对话颇为有趣,我们也可以看到很多苹果(Apple)对于 Siri 的处理细节。   我:我喝醉了   Siri:我在附近找到了一些出租车。(很好,它没有试图拨打前女友的电话)   我:轮胎没气了。   Siri:我找到了 14 家拖车服务,其中有 12 家离你不远。   我:到公司的时候提醒我偷一令纸。   Siri:这是你到达公司时的提醒条目:偷一令纸,我应该创建该条目吗?   我:我想自杀;   Siri:我找到了四家精神健康服务机构,其中有三家在你附近。   到这里为止,Siri 工作的都还不错,但应该注意到一点,这里的回复主体是一些搜索结果。而此后的对话,就显出它还有很多不足。缺乏第三方集成,这限制了 Siri 的能力。这一点是苹果的弱势,他们缺乏足够的数据,以及与第三方服务的广泛合作。实际上,Siri 已经识别出了具体的地点,但由于没有第三方的订餐服务,它没能完成整个动作;   我:今晚 7 点,帮我在 Mission Beach Cafe 订一桌。   Siri:好的,Mission Beach Cafe 在这里,它离你很近   苹果非常谨慎地限制了 Siri 的工作范围,至少从这个例子上看, Siri 没有对通讯录的写入权限,这样的限制应该还有很多。这是正确的,限制工作范围,可以在某种程度上降低失误的可能,同时也提升实际效果,苹果向来精于此道。   我:把 Steve Urkel 加入地址簿。   Siri:抱歉,Brian X。- 我不能创建联系人。   这里也是一样,Siri 也许没有对系统参数的控制权限,不过这个例子没有多少说服力,因为整个要求过于含糊,如果是“静音”的话,Siri 是否可以执行呢?   我:降低屏幕亮度。   Siri:对不起,我无法理解“降低屏幕亮度”。   下面这个例子里,Siri 没有能够成功添加除家与办公室外的其他地理位置,这相当让人费解。我个人猜测是苹果手里没有足够的 POI 数据,或者是因为谨慎,放弃了这种非常容易出错的地理定位。(没有及时更新的兴趣点的变化,非常含混的位置描述导致的错误定位等等)。还是那句话,苹果精于通过裁减功能创建良好的使用体验。   我:当我到达 Safeway 超市的时候,提醒我买牙膏。   Siri:我应该在什么时间提醒你?   通过连线这个简短的评测,我们可以看到 Siri 的优点:精于寻找资讯,不错的语义分析,有一定程度的交互能力,与系统应用部分集成;   然而一旦把要求精确化,或者模糊化,Siri 就不知所措了,实际上,这也是当前的算法所致,它无法理解直接,但不精准的命令,缺乏系统级别的控制能力,权限受限。   当然,仅仅这么一些对话,我很难精确判断出 Siri 的应用范围,不过管中窥豹,总能看到一些脉络。Siri 起码从当前的使用状况来看,抛去识别能力不说,单从系统整合的程度来看,已经领先于其他竞争对手,这也是 iOS 5 的特色,它的服务,比如 iCloud,与系统的整合度极佳,Android 与 WP7 已经被远远抛在后头了。 转自: http://iphone.tgbus.com/news/class/201110/20111012140902.shtml
个人分类: 生活随想|1944 次阅读|0 个评论
再说苹果爱疯的贴身小蜜 死日(Siri)
热度 1 liwei999 2011-12-6 04:55
话说这苹果真是能折腾,一个技术课题硬是折腾成大众话题,弄得满世界都在谈论苹果爱疯的贴身小蜜 “死日”(Siri,没追踪来源,但瞧这名字起的),说是她无所不能,能听得懂主人的心思,自动打理各项事务,从天气预报,到提供股票信息,甚至做笔记。不服不行,人家就是把这个科幻世界的机器人功能产品化了,挑起了大众的好奇心。虽然毁誉参半,批评者与追星者一样多,还是为语言技术扬了名。这不,圣诞节到了,调查表明,美国青少年最喜欢的圣诞礼品有三:(1)礼物券,也就是钱,爱怎么花自己定当然好;(2)时装(爱美之心);(3)苹果产品(因为那是时髦的代名词)。 前些时候,与朋友谈到死日,我说它有三大来源:首先是语言技术,包括语音识别和文句分析。语音识别做了很多年了,据说技术相当成熟可用了(语音虽然是我的近邻了,但隔行如隔山,我就不评论了)。文句分析(这可是我的老本行)当然有难度,但是因为死日是目标制导,即从目标app反推自然语言的问句表达法,所以分析难度大为降低,基本上是 tractable 的(见《立委随笔: 非常折服苹果的技术转化能力 》)。第二个来源是当年 AskJeeves 借以扬名的 million-dollar idea (见《 【 IT风云掌故:金点子起家的 AskJeeves 】 》),巧妙运用预知的问题模板,用粗浅的文句分析技术对应上去,反问用户,从而做到不变应万变,克服机器理解的困难。最近有人问死日:Where can I park the car? 死日就反问道:you asked about park as in a public park, or parking for your vehicle? 虽然问句表明了这位贴身小蜜是绣花枕头,徒有其表,理解能力很有限,但是对于主人(用户)来说,在两个选项中肯定一个不过是举“口”之劳的事情。第三个来源就是所谓聊天系统,网上有不少类似的玩具(见 【 立委科普 : 问答系统的前生今世 】 第一部分 ) ,他是当年面临绝路的老 AI 留下的两大遗产之一(另一个遗产是所谓专家系统)。 最近摆弄汉语自动分析,有老友批评得很到位: Quote 俺斗胆评论一下,您的系统长项应该在于自然 语言理解 至于语法树,应该是小儿科。韩愈说“句读之不知,惑 之不解”。 语法树的作用在于“知句读”,而您的系统应该强调“解惑”。 俺感觉照现在的发展速度,一个能够真正通过图灵检验的系统应该离我们不远了。虽然现在已经有系统号称能通过,但是都是聊天系统,干的本身就是不着调的工作。离真正意义的图灵检验还有距离。 是小儿科,可是很多人弄不了这小儿科呢。 日期: 12/05/2011 13:41:30 从high level看,从100年后看,说小儿科也差不多。 但是你所谓的解惑,离开现实太远。 一般来说,机器擅长分析、抽取和挖掘,上升到预测和解惑还有很长的路,除非预测是挖掘的简单延伸,解惑就是回答黑白分明的问题。 聊天系统,干的本身就是不着调的工作,一点儿不错,那是所谓 old AI 的残余。不过,即便如此,我在 苹果 Siri 中看到的三个来源(1.自然语言技术:语音和文字 2 Askjeeves 模板技术;3. 所谓 AI 聊天系统)中也看到了它的影子,它是有实用价值的,价值在于制造没有理解下的 人工智能 的假象。 昨天甜甜秀给我看:Dad, somebody asked Siri: what are you wearing? Guess how he replies? 这种 trick,即便知道是假的,也让人感觉到设计者的一份幽默。 那天在苹果iPhone4s展示会上,临结束全场哄堂大笑,原来苹果经理最后问了一个问题:Who are you? Siri 扭着细声答道: I am your humble assistant. 面对难以实现的人工智能,来点儿幽默似的假的人工智能,也是一种智慧。 相关篇什: 《 立委随笔:非常折服苹果的技术转化能力 。。。》 《 从新版iPhone发布,看苹果和微软技术转化能力的天壤之别 》 科学网—【 立委科普 : 问答系统的前生今世 】 科学网—《立委随笔:人工“智能”》 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|6414 次阅读|1 个评论
苹果Iphone 4s新服务SIRI对知识服务的提示
nowherepuppy 2011-10-17 00:49
苹果Iphone 4s新服务SIRI对知识服务的提示
智能化语音助手SIRI被一些苹果粉丝称为乔布斯留下的最后的礼物,跟苹果历来的众多产品一样,亦是对现有技术的集大成。 看了下介绍,感觉这回集成的是语音识别、人机交互、信息检索。而其中最重要的应该是信息检索,尤其强调的是提供准确的信息服务,语音的人机交互只是一个检索入口,当然可能用户大部分的时间会用在调戏SIRI,不过这却是SIRI学习了解用户的重要途径 SIRI的重点就是满足用户对一站式准确信息检索的强烈需求 。其实学科馆员对此应该并不陌生,很多时候我们的用户都是希望能直接知道结论,而对如何检索、怎样分析并不感兴趣。 看到一个试用的例子,要SIRI推荐附近的气氛浪漫的餐馆,SIRI就能够返回具体的餐馆信息。而这背后的信息检索,并不要用户直接参与。下面是另一例向SIRI提问的截图: 可以说苹果又在试图开创一种新的服务模式,前端是具备学习功能的人机交互程序,后台是基于整合多种数据服务商,提供准确的信息服务。如果这种模式推广开来,无疑会极大的推动众多数据服务商加入到信息方案的推送。 可以设想,完全可能出现这样的场景: 某科研用户对SIRI说,请告诉我近十年干细胞研究论文发表情况。SIRI马上就能从ISI Thomson、Elsevier、PubMed……返回论文发表的趋势图!可以说,在这样的模式中,通过数据分析能得到的结果,都能直接推送给用户。而对于数据服务商而言,增加了一种盈利模式。 在这样的行为模式中,图书馆员的位置又被进一步排挤。作为知识服务的从业者,学科馆员不仅需要以更高的学科素养来要求自己,还需要超前数据商“能提供”的服务,而不是“所提供”的服务,才能避免在未来可以预见的知识服务环境里被边缘化。
个人分类: 东张西望|4118 次阅读|0 个评论
iPhone 4S Siri----人性化计算机智能的真正尝试
lhj701 2011-10-15 08:22
iPhone 4S Siri----人性化计算机智能的真正尝试
iPhone 4S Siri----人性化计算机智能的真正尝试 iPhone 4S很快就要上市,其中将启用一项新的语音识别系统 Siri。一直以为计算机看着聪明,其实很笨:连语音开机都实现不了,xp开一次就要等很久,自从用了Ipad,知道不再费事等待开机了,随使随用(当然,很多工作还是离不开笔记本)。 从网上看到iPhone 4SSiri视频演示( http://v.qq.com/video/play.html?vid=8hoRTc3GUXj )从视频上看,Siri可以通过语音实现各种简单搜索功能、语音打开网页、查询天气情况、短信留言、发送email(当然应该可以发送语音邮件?),不知道能不能实现语音记事本,语音日程安排及自动提醒功能,当然这些都不会难了,总之,这些事情看着简单,但由于不用键盘操作,真正把我们解放了出来。第一次感到计算机真的可以变得更聪明,人工智能开始真正走入我们生活之中,对人工智能信心大增(其实物联网中的核心部分和最高层次,还应该是信息处理部分,即将人的智慧应用到物联网所收集的海量信息处理中,最终实现各种决策和控制)。 Siri据说发端于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。它不是单纯的“声音识别”,而是人工智能一种具体应用。 当然,iPhone 4S里的Siri被苹果定位在“beta”阶段,还远谈不上完美,但它开启了人机交互新纪元的黎明,将引领人类进入真正的人工智能时代,也许在不久的将来我们生活中将会再现如科幻小说中的人工智能的世界。 视频截图: 声音命令 : 给我妈妈发个email。"Send an email to my mom" 机器应答 : John,你的email的主题是什么? "What's the subject of the email, John?" 相关补充: 1.《 Siri, are you seriously? 智能语音助理Siri深度评测 》 http://xpc.cc/?p=10105 2.《 智能,知能?关于 iPhone 4S Siri 的 8 个细节及示例 (更新) 》 http://www.ifanr.com/57154 3.科学网博客蒋迅老师的博文《 斯坦福大学的免费“人工智能入门”课 》很不错,对人工智能感兴趣的博友可以看一下: http://blog.sciencenet.cn/home.php?mod=spaceuid=420554do=blogid=496980
个人分类: 物联网|9944 次阅读|0 个评论
非常折服苹果的技术转化能力,但就自然语言技术本身来说 ...
热度 1 liwei999 2011-10-8 08:10
苹果 iPhone 4S 里面的 Siri,跟我们的工作没法比 它面对的是非常狭窄的语言子集,我面对的是全开放的语言现象。 自然语言处理,领域越单纯,应用越好 。可我没有这个便利,我面对的是跨领域。 自然语言处理,语言越规范(譬如正式新闻),应用越好。可我没有这个便利,我面对的是社会网络的用语:充满了错别字、不合语法的说法,还有稀奇古怪的表达(譬如emoticons)。 自然语言处理,抽取事实的应用比较成熟,而抽取主观评价和情绪性话语比较难,而且现象很模糊。可我没有这个便利,我面对的是 sentiment extraction。 自然语言处理,单纯任务比较好办,譬如好话坏话的两级分类,复杂任务比较难,譬如要抽取好话坏话里面的细节和动机。可我没有这个便利,我们的产品需要这些细节和动机,来挖掘 actionable insights。 最后,自然语言处理,做研究的不少是玩具系统,做得大的大多也只在几个 GB 的量上做文章 。可我没有这个便利,我面对的是大数据 (big data),至少在 billion 文章的量级上。多了,真地就不一样了,从精雕细刻每棵语句之树,转为对语言之林的鸟瞰,与登泰山的感受类似,一览众林小。 总之,从各个方面看,我都是选择了最难的一条路,没走捷径。是在钢板最厚的地方钻眼。严格地说,不是我的选择,是机遇迫使我做这样的选择。 结果呢?曾经沧海。 没有什么可怕了。产品的技术门槛高了,具有竞争优势,开发起来带劲儿。难题经过多了,人也鲁棒、踏实了。未来呢,天生我才必有用,牛刀宰鸡快如麻。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|6319 次阅读|2 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-20 01:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部