获取网页源码后发现上面和下面有一模一样的内容,导致截取错误,什么情况?
Future 截个图我看看
Future 第一次出现的内容是在head头里面的,用于seo优化的不好删除,建议您先截取
<noscript id="flarum-content"> </noscript>
这里面的内容,然后再截取您需要的内容
内容长度剪短后恢复正常
还是要改进一下
ikxin 截图上面不是有吗?
ikxin 主要就说如果帖子内容过长,hs获取再sj截取之后就会像上面截图的那样
Future 上面没有图片呀
Future 看到了,图片链接的ssl证书出错了
ikxin 好的,谢谢
| | 粤ICP备2021024472号