<noframes id="z7bdd"><pre id="z7bdd"><strike id="z7bdd"></strike></pre>
    <output id="z7bdd"><ruby id="z7bdd"><dfn id="z7bdd"></dfn></ruby></output>
    <address id="z7bdd"><strike id="z7bdd"></strike></address>
    <sub id="z7bdd"></sub><noframes id="z7bdd">

        <track id="z7bdd"></track>

        基于sklearn庫,搭建一個簡單的問答系統

        日期: 2018-12-06 09:22:57 / 人氣: 3335

        第一部分: 在這部分里,首先需要去讀取給定的文件,并把文件里的內容讀取到list里面。這部分的任務主要需要文件IO操作方面的基本知識。


        第二部分: 處理已有的字符串數據,并把它們轉換成詞袋向量。這部分內容涉及到一些簡單的字符串預處理技術(比如過濾掉一些沒用的字符、分詞等),還有就是基于sklearn的把字符串轉換向量的過程。本部分的內容需要字符串操作、分詞、詞袋模型相關的基礎知識。

        部分: 對于用戶的新輸入,返回答案。 這是最后一部分,也就是等我們創建完詞袋向量之后,我們就可以輸入一些新的問題,然后從庫中找出最合適的答案。這部分的任務涉及到余弦相似度、簡單搜索排序等方面基礎知識。

        輸入問題,查看結果


        print(answer("誰知道網上找兼職工作的網站"))

         
        搜索結果如下:

        這里沒有對返回數據進行過清洗,否則體驗會更好一些…

        --------------------- 
        作者:簡單隨風 
        來源:CSDN 
        原文:blog.csdn.net/lt326030434/article/details/82909589 


        欲求不满的人妻日本电影
        <noframes id="z7bdd"><pre id="z7bdd"><strike id="z7bdd"></strike></pre>
          <output id="z7bdd"><ruby id="z7bdd"><dfn id="z7bdd"></dfn></ruby></output>
          <address id="z7bdd"><strike id="z7bdd"></strike></address>
          <sub id="z7bdd"></sub><noframes id="z7bdd">

              <track id="z7bdd"></track>