新用户注册入口 老用户登录入口

在搜索引擎爬虫眼里,html+css编写的几个好习惯,这里整理了10个

文章作者:admin-tim 更新时间:2024-01-26 18:58:53 阅读数量:502
文章标签:htmlcss元数据标题锚元素隐藏文字
本文摘要:本文介绍了10个html+css编码中注意的地方,特别对于搜索引擎爬虫而言,一些要注意的地方。可能对于用户而言,观感上没什么区别,但对于搜索引擎理解代码的时候,可以起到正向的帮助作用。作者才疏学浅,如有转载,请标明出处哦。
HTML

html编码中,一些习惯性的编码习惯,可能会带来界面上不错的效果,但是在seo角度讲,可能存在一些问题。

本文只整理了10个常见的html编码习惯的问题,也包括个别css的,供大家参考。


1. 每页页面要有h1标签

页面的title元数据标签,大家非常了解,对于搜索引擎爬取、收录、排名,至关重要。这里面一般要包含目标关键字。

但是当爬虫理解页面内容的时候,还会参考h1标签,h1标签的权重稍次于title元数据标签,但是也是十分重要的。所以,应该在h1标签中大大方方的写出本页的标题

另外,一定不要用隐藏的h1标签,隐藏文字在seo中是有可能会被判定为作弊的

<!DOCTYPE html>
2<html lang="en">
3<head>
4  <meta charset="UTF-8">
5  <title>页面标题示例</title>
6</head>
7<body>
8
9  <!-- h1 标签用于定义一级标题 -->
10  <h1>欢迎来到我们的网站 - 主页</h1>
11
12  <!-- 网页的主体内容 -->
13  <p>这是一个演示如何使用HTML h1标签的例子。在这个网页中,我们用<h1>标签来呈现主要的、最高级别的标题。</p>
14
15  <!-- 更多内容... -->
16  
17</body>
18</html>


2. 写好img标签的alt属性

正确写好alt标签有下面几点好处:

  • 当图片无法加载的时候,alt的文本就会显示在页面上,让用户知道这张图片是介绍了什么内容。
  • 可以让搜索引擎理解这站图片的内容,从而可以有可能把这个图片索引到图片库中,在搜索图片的时候就有可能带出来。
  • 如果图片是页面的第一个元素,更要写好alt属性,这有利于搜索引擎理解本页面的页面内容。
  • 图片做logo,logo是锚元素,即<a href='xxx'><img src='xxx' alt='公司logo'></a>这样的时候,图片的alt就相当于锚文本的文字(所以别草草几句就搞定了),锚文本的作用十分关键!

<!DOCTYPE html>
2<html lang="en">
3<head>
4  <meta charset="UTF-8">
5  <title>图片及alt属性示例</title>
6</head>
7<body>
8
9  <!-- 使用img标签插入一张图片,并设置alt属性 -->
10  <p>下面是一张描述美丽风景的图片:</p>
11  <img src="beautiful-scenery.jpg" alt="美丽的山川湖泊景色,天空湛蓝,湖面如镜,周围环绕着翠绿的森林。">
12
13  <!-- 如果图片因为某种原因无法加载时,浏览器将显示alt文本 -->
14  <!-- 对于视力障碍用户使用屏幕阅读器时,也会读出该alt文本 -->
15
16</body>
17</html>


3. 特定的锚元素加nofollow

如果你的页面上有一些外链,或者不需要被跟踪的内链,请对他们加上这个属性。

<!DOCTYPE html>
2<html lang="en">
3<head>
4  <meta charset="UTF-8">
5  <title>nofollow属性示例</title>
6</head>
7<body>
8
9  <!-- 正常的超链接 -->
10  <p>访问我们的<a href="https://www.example.com" target="_blank">主页</a></p>
11
12  <!-- 使用nofollow属性的超链接 -->
13  <p>外部链接示例:这是一个带有nofollow属性的<a href="https://www.external-site.com" rel="nofollow" target="_blank">外部网站链接</a>,搜索引擎不会通过这个链接来传递我们网页的权重。</p>
14
15</body>
16</html>

这会让搜索引擎知道这个链接不是受站长推荐的,可能会继续爬取或不继续爬取,但不会传递权重。

尤其对于新站,每天爬虫来访的频次和深度其实都比较有限,所以正确的时候nofollow(无论在外链或内链上),可以一定程度上把爬虫引入正确的爬行轨迹

但是,爬虫的爬取,也是有它自己的想法,不能说加上nofollow就一定有作用。


4. 所有el-link一律用a代替

比如使用了element-ui或其它的前端库,其锚元素并不是<a>而是比如<el-link>这样的元素。请优先使用<a>。

  • 尽管在页面审查元素的时候可以看到<el-link>已经被正确的解析为了<a>,但是在右键-查看网页源代码的时候,依旧是<el-link>。
  • 尽管现在的搜索引擎爬虫可以很好的解析动态页面,但不排除对于新站或权重低的站点,仍然就是拿到源代码做解析(节省计算资源嘛)。

所以,为了安全起见,还是优先使用<a>作为锚元素,确保内链的建设能够得到正确的爬取!


5. 移动端文字适配

也许你没有单独做一个移动站,只做了一个pc站。但当你手机上访问站点的时候,发现站点的文字发生了异常的突变,指定fong-size不生效。

这时候你可能就要使用:-webkit-text-size-adjust: none

试试吧,你会发现药到病除!


6. html的title中元素的顺序很重要

举几个例子:

  • 第一页: 分类名称-网站名称
  • 第二页: 分类名称-第二页-网站名称
  • 文章页面: 文章标题-网站名称

如果要使用符号,尽量使用中划线或下划线,不要使用其它特殊符号。


7. 加入新的meta标签

content-language、author,尤其是content-language,在必应bing的站长后台做网站体检的时候还会提示站长(尽管不是一个很严重的问题)。

<!DOCTYPE html>
2<html lang="zh-CN">
3<head>
4  <meta charset="UTF-8">
5  <!-- 设置网页内容的语言 -->
6  <meta http-equiv="Content-Language" content="zh-CN">
7  
8  <!-- 指定网页作者 -->
9  <meta name="author" content="张三">
10  
11  <title>示例网页 - HTML Meta 标签使用</title>
12  
13  <!-- 其他元信息,如网页描述 -->
14  <meta name="description" content="这是一个关于HTML Meta标签content-language和author属性使用的示例网页。">
15  
16</head>
17<body>
18  <!-- 网页正文内容 -->
19  ...
20</body>
21</html>


8. 减少html中的注释

一方面,有利于减少响应文本的体积,降低服务器带宽。

另一方面,有利于搜索引擎的爬虫理解页面内容,试想,如果一个页面50%的注释,那么搜索引擎理解起来也会有难度。


9. 不要使用table布局或其它复杂布局

搜索引擎爬虫对页面内容的理解不像人类的肉眼,它是需要基于代码的。

如果代码结构比较复杂,它会比较反感这样的代码,甚至会跑路。所以,简单整洁的代码是招引爬虫来的很重要的因素。

所以,不要使用比较复杂布局代码,能写到css文件里的就用css文件搞定


10. 不要使用隐藏文字

无论是什么样的初心,使用了隐藏文字,都会被搜索引擎认为是作弊。

比如:文字颜色和背景色颜色一样、文字使用absolute绝对定位定位到可视便捷以外、文字用z-index定位到最下层...

尽管用户看不到,但搜索引擎的爬虫阅读源码会看到,尽管不一定能够正确识别这些文字是隐藏文字,但一旦识别出来,就会被判断为作弊站点。

另外,当用户点击某按钮后出来的文字,属于正常的交互,不属于隐藏文字。



相关阅读
文章标题:冰墩墩html css代码

更新时间:2023-07-30
冰墩墩html css代码
文章标题:webpack --watch 模式下利用自定义插件CopyAfterCompilePlugin实现编译完成后文件实时拷贝至指定目录

更新时间:2023-12-07
webpack --watch 模式下利用自定义插件CopyAfterCompilePlugin实现编译完成后文件实时拷贝至指定目录
文章标题:分页的html代码

更新时间:2023-07-10
分页的html代码
文章标题:解决服务器部署中视图文件路径错误:配置设置、引擎支持与相对/绝对路径应用实践

更新时间:2023-11-08
解决服务器部署中视图文件路径错误:配置设置、引擎支持与相对/绝对路径应用实践
文章标题:Bootstrap滚动监听无效问题排查:jQuery与DOMContentLoaded事件应用及CSS样式冲突解决方案

更新时间:2023-01-14
Bootstrap滚动监听无效问题排查:jQuery与DOMContentLoaded事件应用及CSS样式冲突解决方案
文章标题:倒数html代码

更新时间:2023-11-11
倒数html代码
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
ssh user@hostname - 远程登录到另一台Linux主机。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
多语言环境下的ActiveMQ部署:统一消息格式与API接口实践 10-09 支持6种放大模式的jQuery图片放大镜插件 09-05 在Spring Boot应用中配置Nginx反向代理并实现HTTPS的SSL证书设置,包括请求路径获取与proxy_pass用法详解 01-22 白色纯净精品星级豪华酒店预定网站模板 12-30 egg.js-趣味复活节彩蛋js插件 11-05 在Apache Hive中运用窗口函数进行多列排序与聚合操作:分区、排序与ROW_NUMBER()实践 10-19 数字代理商业公司模板下载 10-16 MongoDB查询操作符详解:从基础到高级用法,涵盖$eq、范围查询与内嵌文档查询至汇总查询与aggregate应用 10-04 Mahout版本更新后应对API弃用:从旧版GenericItemBasedRecommender到新版recommend()方法的重构实践 09-14 本次刷新还10个文章未展示,点击 更多查看。
PostgreSQL数据库中InvalidColumnTypeCastError错误:原因、检查与转换函数解决方案 08-30 SpringCloud网关与OAuth2访问权限管理在微服务架构中的实践运用 07-15 [转载]每个字符旋转随机角度的图象验证码 V2.0 05-27 [转载]关于mysql的一些小知识 04-26 简洁披萨快餐厅外卖网站模板下载 04-03 Logstash内存不足问题解决方案:调整pipeline.workers、队列大小与分批处理数据实践 03-27 [转载]DevOps相关知识点 03-19 Swiper-强大的移动手机端幻灯片插件 02-09 字母个性质感高级机构动态HTML5网站模板 01-12 红色大气企业数据统计后台管理网站模板 01-03 python每日定时任务 01-01
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"