自动外链工具 在线排版工具 搜索引擎提交入口 wordpress主题推荐 批量打开网址工具 【老域名购买】 思享SEO导航 【网站合作】

AI伪原创原理是什么,对SEO有用吗

321

市面上已经有众多【AI伪原创】工具,看产品说明,介绍是基于NPL卷积神经网络千万语料库机器学习生成的文章。

百度“AI伪原创”,随便找一款产品,测试一下伪原创效果:

巧了,这个伪原创的内容,跟Google中英互译两次的结果一样:

 

 

所以我们要实现市面上“AI伪原创”的功能,不需要搞“NPL卷积神经网络千万语料库机器学习”神马的,只要调用Google翻译,执行“中--->英--->中”两次翻译即可。于是google搜罗并修改一番,见代码:

  1. import requests  
  2. import json  
  3. from bs4 import BeautifulSoup  
  4. import execjs  
  5. from aip import AipNlp  
  6.   
  7. """ 你的 APPID AK SK """  
  8. APP_ID = 'you id'  
  9. API_KEY = 'you api key'  
  10. SECRET_KEY = 'you secret key'  
  11.   
  12. client = AipNlp(APP_ID, API_KEY, SECRET_KEY)  
  13.   
  14. class Py4Js():  
  15.   
  16.     def __init__(self):   
  17.         self.ctx = execjs.compile("" 
  18.         function TL(a) {  
  19.         var k = "";  
  20.         var b = 406644;  
  21.         var b1 = 3293161072;              
  22.         var jd = ".";  
  23.         var $b = "+-a^+6";  
  24.         var Zb = "+-3^+b+-f";        
  25.         for (var e = [], f = 0, g = 0; g < a.length; g++) {  
  26.                 var m = a.charCodeAt(g);  
  27.                 128 > m ? e[f++] = m : (2048 > m ? e[f++] = m >> 6 | 192 : (55296 == (m & 64512) && g + 1 < a.length && 56320 == (a.charCodeAt(g + 1) & 64512) ? (m = 65536 + ((m & 1023) << 10) + (a.charCodeAt(++g) & 1023),  
  28.                 e[f++] = m >> 18 | 240,  
  29.                 e[f++] = m >> 12 & 63 | 128) : e[f++] = m >> 12 | 224,  
  30.                 e[f++] = m >> 6 & 63 | 128),  
  31.                 e[f++] = m & 63 | 128)  
  32.         }  
  33.         a = b;  
  34.         for (f = 0; f < e.length; f++) a += e[f],  
  35.         a = RL(a, $b);  
  36.         a = RL(a, Zb);  
  37.         a ^= b1 || 0;  
  38.         0 > a && (a = (a & 2147483647) + 2147483648);  
  39.         a %= 1E6;  
  40.         return a.toString() + jd + (a ^ b)  
  41.     };           
  42.     function RL(a, b) {  
  43.         var t = "a";  
  44.         var Yb = "+";  
  45.         for (var c = 0; c < b.length - 2; c += 3) {  
  46.                 var d = b.charAt(c + 2),  
  47.                 d = d >= t ? d.charCodeAt(0) - 87 : Number(d),  
  48.                 d = b.charAt(c + 1) == Yb ? a >>> d: a << d;  
  49.                 a = b.charAt(c) == Yb ? a + d & 4294967295 : a ^ d  
  50.         }  
  51.         return a  
  52.     }  
  53.  """)  
  54.     def getTk(self,text):  
  55.         return self.ctx.call("TL",text)  
  56.   
  57. def buildUrl(text,tk,language):  
  58.   
  59.     baseUrl='https://translate.google.cn/translate_a/single'  
  60.     baseUrl+='?client=t&'  
  61.       
  62.     if language == 'en-zh':  
  63.         baseUrl+='s1=en&'  
  64.         baseUrl+='t1=zh-CN&'  
  65.         baseUrl+='h1=zh-CN&'  
  66.     elif language == 'zh-en':  
  67.         baseUrl+='sl=zh-CN&'  
  68.         baseUrl+='tl=en&'  
  69.         baseUrl+='hl=zh-CN&'  
  70.           
  71.     baseUrl+='dt=at&'  
  72.     baseUrl+='dt=bd&'  
  73.     baseUrl+='dt=ex&'  
  74.     baseUrl+='dt=ld&'  
  75.     baseUrl+='dt=md&'  
  76.     baseUrl+='dt=qca&'  
  77.     baseUrl+='dt=rw&'  
  78.     baseUrl+='dt=rm&'  
  79.     baseUrl+='dt=ss&'  
  80.     baseUrl+='dt=t&'  
  81.     baseUrl+='ie=UTF-8&'  
  82.     baseUrl+='oe=UTF-8&'  
  83.     baseUrl+='otf=1&'  
  84.     baseUrl+='pc=1&'  
  85.     baseUrl+='ssel=0&'  
  86.     baseUrl+='tsel=0&'  
  87.     baseUrl+='kc=2&'  
  88.     baseUrl+='tk='+str(tk)+'&'  
  89.     baseUrl+='q='+text  
  90.     return baseUrl  
  91.   
  92.   
  93. def translate(language,text):  
  94.     header={  
  95.         'authority':'translate.google.cn',  
  96.         'method':'GET',  
  97.         'path':'',  
  98.         'scheme':'https',  
  99.         'accept':'*/*',  
  100.         'accept-encoding':'gzip, deflate, br',  
  101.         'accept-language':'zh-CN,zh;q=0.9',  
  102.         'cookie':'',  
  103.         'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64)  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',  
  104.         'x-client-data':'CIa2yQEIpbbJAQjBtskBCPqcygEIqZ3KAQioo8oBGJGjygE='  
  105.     }  
  106.     url=buildUrl(text,js.getTk(text),language)  
  107.     res=''  
  108.     try:  
  109.         r=requests.get(url)  
  110.         result=json.loads(r.text)  
  111.         #print (result)  
  112.         if result[7]!=None:  
  113.             # 如果我们文本输错,提示你是不是要找xxx的话,那么重新把xxx正确的翻译之后返回  
  114.             try:  
  115.                 correctText=result[7][0].replace('<b><i>',' ').replace('</i></b>','')  
  116.                 print(correctText)  
  117.                 correctUrl=buildUrl(correctText,js.getTk(correctText),language)  
  118.                 correctR=requests.get(correctUrl)  
  119.                 newResult=json.loads(correctR.text)  
  120.                 res=newResult[0][0][0]  
  121.   
  122.             except Exception as e:  
  123.                 print(e)  
  124.                 for r in result[0]:   
  125.                     if r[0] is not None:   
  126.                         res += r[0]  
  127.   
  128.         else:  
  129.             for r in result[0]:   
  130.                 if r[0] is not None:   
  131.                     res += r[0]  
  132.     except Exception as e:  
  133.         res=''  
  134.         print(url)  
  135.         print("翻译"+text+"失败")  
  136.         print("错误信息:")  
  137.         print(e)  
  138.     finally:  
  139.         return res  
  140.   
  141. def dnnlm(text):  
  142.     dnn = client.dnnlm(text)  
  143.     return dnn["ppl"]  
  144.           
  145.           
  146. text = "测试一下这个软件好不好用,输出的文字能否读通"  
  147.   
  148. if __name__ == '__main__':  
  149.     js=Py4Js()  
  150.     yw = translate('zh-en',text)  
  151.     res_enzh = translate('en-zh',yw)  
  152.     print ("原文:",text)  
  153.     print ("英文:",yw)  
  154.     print ("伪原创:",res_enzh)  
  155.     #print (dnnlm(text),dnnlm(res_enzh))  

输出结果与Google翻译一致:

那么问题来了,这种中英中互译两次出来的文字,搜索引擎能否看出来呢?我们找下百度AI开放平台,自然语言分析里有一项“DNN语言模型”,文档中说明可以判断句子是否符合语言表达习惯。我姑且理解为,判断一句话是人写的概率有多大

我们依次跑下原始句子,和伪原创句子的通顺度:

看来对百度爸爸而言,原始句子通顺的多。我们再多测试几个句子:

蜜汁尴尬^1

蜜汁尴尬^2

蜜汁尴尬^3

一些搬运英文视频,添加中文字幕;或通过音频生成文章的自媒体,同理;

本文来源:【如何实现AI伪原创?
思享SEO博客编辑转载,仅用于参考学习,如有侵权请联系本站修改删除!
seo培训评论广告

抢沙发

昵称*

邮箱*

网址