AI伪原创原理是什么,对SEO有用吗

自媒体 投稿&转载 1675浏览

市面上已经有众多【AI伪原创】工具,看产品说明,介绍是基于NPL卷积神经网络千万语料库机器学习生成的文章。

百度“AI伪原创”,随便找一款产品,测试一下伪原创效果:

巧了,这个伪原创的内容,跟Google中英互译两次的结果一样:

 

 

所以我们要实现市面上“AI伪原创”的功能,不需要搞“NPL卷积神经网络千万语料库机器学习”神马的,只要调用Google翻译,执行“中--->英--->中”两次翻译即可。于是google搜罗并修改一番,见代码:

  1. import requests  
  2. import json  
  3. from bs4 import BeautifulSoup  
  4. import execjs  
  5. from aip import AipNlp  
  6.   
  7. """ 你的 APPID AK SK """  
  8. APP_ID = 'you id'  
  9. API_KEY = 'you api key'  
  10. SECRET_KEY = 'you secret key'  
  11.   
  12. client = AipNlp(APP_ID, API_KEY, SECRET_KEY)  
  13.   
  14. class Py4Js():  
  15.   
  16.     def __init__(self):   
  17.         self.ctx = execjs.compile("" 
  18.         function TL(a) {  
  19.         var k = "";  
  20.         var b = 406644;  
  21.         var b1 = 3293161072;              
  22.         var jd = ".";  
  23.         var $b = "+-a^+6";  
  24.         var Zb = "+-3^+b+-f";        
  25.         for (var e = [], f = 0, g = 0; g < a.length; g++) {  
  26.                 var m = a.charCodeAt(g);  
  27.                 128 > m ? e[f++] = m : (2048 > m ? e[f++] = m >> 6 | 192 : (55296 == (m & 64512) && g + 1 < a.length && 56320 == (a.charCodeAt(g + 1) & 64512) ? (m = 65536 + ((m & 1023) << 10) + (a.charCodeAt(++g) & 1023),  
  28.                 e[f++] = m >> 18 | 240,  
  29.                 e[f++] = m >> 12 & 63 | 128) : e[f++] = m >> 12 | 224,  
  30.                 e[f++] = m >> 6 & 63 | 128),  
  31.                 e[f++] = m & 63 | 128)  
  32.         }  
  33.         a = b;  
  34.         for (f = 0; f < e.length; f++) a += e[f],  
  35.         a = RL(a, $b);  
  36.         a = RL(a, Zb);  
  37.         a ^= b1 || 0;  
  38.         0 > a && (a = (a & 2147483647) + 2147483648);  
  39.         a %= 1E6;  
  40.         return a.toString() + jd + (a ^ b)  
  41.     };           
  42.     function RL(a, b) {  
  43.         var t = "a";  
  44.         var Yb = "+";  
  45.         for (var c = 0; c < b.length - 2; c += 3) {  
  46.                 var d = b.charAt(c + 2),  
  47.                 d = d >= t ? d.charCodeAt(0) - 87 : Number(d),  
  48.                 d = b.charAt(c + 1) == Yb ? a >>> d: a << d;  
  49.                 a = b.charAt(c) == Yb ? a + d & 4294967295 : a ^ d  
  50.         }  
  51.         return a  
  52.     }  
  53.  """)  
  54.     def getTk(self,text):  
  55.         return self.ctx.call("TL",text)  
  56.   
  57. def buildUrl(text,tk,language):  
  58.   
  59.     baseUrl='https://translate.google.cn/translate_a/single'  
  60.     baseUrl+='?client=t&'  
  61.       
  62.     if language == 'en-zh':  
  63.         baseUrl+='s1=en&'  
  64.         baseUrl+='t1=zh-CN&'  
  65.         baseUrl+='h1=zh-CN&'  
  66.     elif language == 'zh-en':  
  67.         baseUrl+='sl=zh-CN&'  
  68.         baseUrl+='tl=en&'  
  69.         baseUrl+='hl=zh-CN&'  
  70.           
  71.     baseUrl+='dt=at&'  
  72.     baseUrl+='dt=bd&'  
  73.     baseUrl+='dt=ex&'  
  74.     baseUrl+='dt=ld&'  
  75.     baseUrl+='dt=md&'  
  76.     baseUrl+='dt=qca&'  
  77.     baseUrl+='dt=rw&'  
  78.     baseUrl+='dt=rm&'  
  79.     baseUrl+='dt=ss&'  
  80.     baseUrl+='dt=t&'  
  81.     baseUrl+='ie=UTF-8&'  
  82.     baseUrl+='oe=UTF-8&'  
  83.     baseUrl+='otf=1&'  
  84.     baseUrl+='pc=1&'  
  85.     baseUrl+='ssel=0&'  
  86.     baseUrl+='tsel=0&'  
  87.     baseUrl+='kc=2&'  
  88.     baseUrl+='tk='+str(tk)+'&'  
  89.     baseUrl+='q='+text  
  90.     return baseUrl  
  91.   
  92.   
  93. def translate(language,text):  
  94.     header={  
  95.         'authority':'translate.google.cn',  
  96.         'method':'GET',  
  97.         'path':'',  
  98.         'scheme':'https',  
  99.         'accept':'*/*',  
  100.         'accept-encoding':'gzip, deflate, br',  
  101.         'accept-language':'zh-CN,zh;q=0.9',  
  102.         'cookie':'',  
  103.         'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64)  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',  
  104.         'x-client-data':'CIa2yQEIpbbJAQjBtskBCPqcygEIqZ3KAQioo8oBGJGjygE='  
  105.     }  
  106.     url=buildUrl(text,js.getTk(text),language)  
  107.     res=''  
  108.     try:  
  109.         r=requests.get(url)  
  110.         result=json.loads(r.text)  
  111.         #print (result)  
  112.         if result[7]!=None:  
  113.             # 如果我们文本输错,提示你是不是要找xxx的话,那么重新把xxx正确的翻译之后返回  
  114.             try:  
  115.                 correctText=result[7][0].replace('<b><i>',' ').replace('</i></b>','')  
  116.                 print(correctText)  
  117.                 correctUrl=buildUrl(correctText,js.getTk(correctText),language)  
  118.                 correctR=requests.get(correctUrl)  
  119.                 newResult=json.loads(correctR.text)  
  120.                 res=newResult[0][0][0]  
  121.   
  122.             except Exception as e:  
  123.                 print(e)  
  124.                 for r in result[0]:   
  125.                     if r[0] is not None:   
  126.                         res += r[0]  
  127.   
  128.         else:  
  129.             for r in result[0]:   
  130.                 if r[0] is not None:   
  131.                     res += r[0]  
  132.     except Exception as e:  
  133.         res=''  
  134.         print(url)  
  135.         print("翻译"+text+"失败")  
  136.         print("错误信息:")  
  137.         print(e)  
  138.     finally:  
  139.         return res  
  140.   
  141. def dnnlm(text):  
  142.     dnn = client.dnnlm(text)  
  143.     return dnn["ppl"]  
  144.           
  145.           
  146. text = "测试一下这个软件好不好用,输出的文字能否读通"  
  147.   
  148. if __name__ == '__main__':  
  149.     js=Py4Js()  
  150.     yw = translate('zh-en',text)  
  151.     res_enzh = translate('en-zh',yw)  
  152.     print ("原文:",text)  
  153.     print ("英文:",yw)  
  154.     print ("伪原创:",res_enzh)  
  155.     #print (dnnlm(text),dnnlm(res_enzh))  

输出结果与Google翻译一致:

那么问题来了,这种中英中互译两次出来的文字,搜索引擎能否看出来呢?我们找下百度AI开放平台,自然语言分析里有一项“DNN语言模型”,文档中说明可以判断句子是否符合语言表达习惯。我姑且理解为,判断一句话是人写的概率有多大

我们依次跑下原始句子,和伪原创句子的通顺度:

看来对百度爸爸而言,原始句子通顺的多。我们再多测试几个句子:

蜜汁尴尬^1

蜜汁尴尬^2

蜜汁尴尬^3

一些搬运英文视频,添加中文字幕;或通过音频生成文章的自媒体,同理;

推荐阅读

python怎么采集内容标题进行重写伪原创

内容采集是站长常常需要的工作,而为了进一步提升采集内容的SEO价值,往往需要对内容进行进一步处理,其中修改标题就是最重要的一项,如果一个个修改太累了,怎么通过python批量进程重写伪原创呢?...

为什么原创内容没有好的排名?

因为搜索排序他会受到多种维度,多种因素的影响,不光只是考核原创性,还有站点的综合质量,以及用户喜爱程度。...

原创内容被排名更好的网站复制转载该怎么办?

请通过以下方式举报:https://www.wenjuan.com/s/UZBZJv7gVT/ ,同时也可以在反馈中心进行反馈 相关SEO术语解释: K站: 网站优化中比较常见的一个名词,它所指的是在网站已经达到正常收录的状态下因为作弊或者其他原因,......