开网站的是啥公司江门网站制作系统

当前位置: 首页 > news >正文

开网站的是啥公司,江门网站制作系统,三亚网站建设品牌,erp排名前十的软件缓存能够有效地加速应用的读写速度#xff0c;同时也可以降低后端负载#xff0c;对日常应用的开发至关重要。但是将缓存加入应用架构后也会带来一些问题#xff0c;本文将针对这些问题介绍缓存使用技巧和设计方案。 1缓存的收益和成本 下图左侧为客户端直接调用存储层的架…缓存能够有效地加速应用的读写速度同时也可以降低后端负载对日常应用的开发至关重要。但是将缓存加入应用架构后也会带来一些问题本文将针对这些问题介绍缓存使用技巧和设计方案。 1缓存的收益和成本 下图左侧为客户端直接调用存储层的架构右侧为比较典型的缓存层存储层架构下面分析一下缓存加入后带来的收益和成本。 收益如下: 加速读写因为缓存通常都是全内存的(例如Redis、Memcache)而存储层通常读写性能不够强悍(例如MySQL)通过缓存的使用可以有效地加速读写优化用户体验。 降低后端负载帮助后端碱少访问量和复杂计算(例如很复杂的SQL语句)在很大程度降低了后端的负载。 成本如下 数据不一致性缓存层和存储层的数据存在着一定时间窗口的不一致性时间窗口跟更新策略有关。 代码维护成本加人缓存后需要同时处理缓存层和存储层的逻辑增大了开发者维护代码的成本。 运维成本以Redis Cluster为例加入后无形中增加了运维成本。 缓存的使用场景基本包含如下两种 开销大的复杂计算以MySQL为例子–些复杂的操作或者计算(例如大量联表操作、一些分组计算)如果不加缓存不但无法满足高并发量同时也会给MySQL带来巨大的负担。 加速请求响应即使查询单条后端数据足够快(例如select * from table where id?)那么依然可以使用缓存以Redis为例子每秒可以完成数万次读写并且提供的批量操作可以优化整个IO链的响应时间。 2缓存更新策略 缓存中的数据通常都是有生命周期的需要在指定时间后被删除或更新这样可以保证缓存空间在一个可控的范围。但是缓存中的数据会和数据源中的真实数据有一段时间窗口的不一致需要利用某些策略进行更新。下面将分别从使用场景、一致性、开发人员开发维护成本三个方面介绍三种缓存的更新策略。 (1)LRU/LFU/FIFO算法剔除 使用场景。剔除算法通常用于缓存使用量超过了预设的最大值时候如何对现有的数据进行剔除。例如Redis使用maxmemory-policy这个配置作为内存最大值后对于数据的剔除策略。 一致性。要清理哪些数据是由具体算法决定开发人员只能决定使用哪种算法所以数据的一致性是最差的。 维护成本。算法不需要开发人员自己来实现通常只需要配置最大maxmemory和对应的策略即可。开发人员只需要知道每种算法的含义选择适合自己的算法即可。 (2)超时剔除 使用场景。超时剔除通过给缓存数据设置过期时间让其在过期时间后自动删除例如Redis提供的expire命令。如果业务可以容忍一段时间内缓存层数据和存储层数据不一致那么可以为其设置过期时间。在数据过期后再从真实数据源获取数据重新放到缓存并设置过期时间。例如一个视频的描述信息可以容忍几分钟内数据不一致但是涉及交易方面的业务后果可想而知。 一致性。一段时间窗口内(取决于过期时间长短)存在一致性问题即缓存数据和真实数据源的数据不一致。 维护成本。维护成本不是很高只需设置expire过期时间即可当然前提是应用方允许这段时间可能发生的数据不一致。 (3)主动更新 使用场景。应用方对于数据的一致性要求高需要在真实数据更新后立即更新缓存数据。例如可以利用消息系统或者其他方式通知缓存更新。 一致性。一致性最高但如果主动更新发生了问题那么这条数据很可能很长时间不会更新所以建议结合超时剔除一起使用效果会更好。 维护成本。维护成本会比较高开发者需要自己来完成更新并保证更新操作的正确性。 下表给出了缓存的三种常见更新策略的对比。 (4)最佳实践 有两个建议 低一致性业务建议配置最大内存和淘汰策略的方式使用。 高一致性业务可以结合使用超时剔除和主动更新这样即使主动更新出了问题也能 保证数据过期时间后删除脏数据。 3缓存粒度控制 下图是很多项目关于缓存比较常用的选型缓存层选用Redis存储层选用MySQL。 例如现在需要将MySQL的用户信息使用Redis缓存可以执行如下操作 从MySQL获取用户信息 select * from user where id{id} 将用户信息缓存到Redis中 set user: {id}  select * from user where id{id}
假设用户表有100个列需要缓存到什么维度呢? 缓存全部列 set user:{id} select * from user where id{id}
缓存部分重要列 set user:{id} select {importantColumn1}{important Column2} … { importantColumnN} from user where id{id} 上述这个问题就是缓存粒度问题究竟是缓存全部属性还是只缓存部分重要属性呢?下面将从通用性、空间占用、代码维护三个角度进行说明。 通用性。缓存全部数据比部分数据更加通用但从实际经验看很长时间内应用只需要几个重要的属性。 空间占用。缓存全部数据要比部分数据占用更多的空间可能存在以下问题 全部数据会造成内存的浪费。 全部数据可能每次传输产生的网络流量会比较大耗时相对较大在极端情况下会阻塞网络。 全部数据的序列化和反序列化的CPU开销更大。 代码维护。全部数据的优势更加明显而部分数据一旦要加新字段需要修改业务代码而且修改后通常还需要刷新缓存数据。 下表给出缓存全部数据和部分数据在通用性、空间占用、代码维护上的对比。 缓存粒度问题是一个容易被忽视的问题如果使用不当可能会造成很多无用空间的浪费网络带宽的浪费代码通用性较差等情况需要综合数据通用性、空间占用比、代码维护性三点进行取舍。 4穿透优化 缓存穿透是指查询一个根本不存在的数据缓存层和存储层都不会命中通常出于容错的考虑如果从存储层查不到数据则不写人缓存层如下图所示整个过程分为如下3步 (1)缓存层不命中。 (2)存储层不命中不将空结果写回缓存。 (3)返回空结果。 缓存穿透将导致不存在的数据每次请求都要到存储层去查询失去了缓存保护后端存储的意义。 缓存穿透问题可能会使后端存储负载加大由于很多后端存储不具备高并发性甚至可能造成后端存储宕掉。通常可以在程序中分别统计总调用数、缓存层命中数、存储层命中数如果发现大量存储层空命中可能就是出现了缓存穿透问题。 造成缓存穿透的基本原因有两个。第一自身业务代码或者数据出现问题第二一些恶意攻击、爬虫等造成大量空命中。下面我们来看一下如何解决缓存穿透问题。 (1)缓存空对象 如下图所示当第2步存储层不命中后仍然将空对象保留到缓存层中之后再访问这个数据将会从缓存中获取这样就保护了后端数据源。 缓存空对象会有两个问题第一空值做了缓存意味着缓存层中存了更多的键需要更多的内存空间(如果是攻击问题更严重)比较有效的方法是针对这类数据设置一个较短的过期时间让其自动剔除。第二缓存层和存储层的数据会有一段时间窗口的不一致可能会对业务有一定影响。例如过期时间设置为5分钟如果此时存储层添加了这个数据那此段时间就会出现缓存层和存储层数据的不一致此时可以利用消息系统或者其他方式清除掉缓存层中的空对象。 下面给出了缓存空对象的实现代码 String get (String key) {//从缓存中获取数据String cacheValue cache.get(key);//缓存为空if (StringUtils.isBlank (cacheValue)){//从存储中获取String storageValue storage.get(key);cache.set(key, storageValue);//如果存储数据为空需要设置一个过期时间(300秒)if (storageValue null) {cache.expire(key,60 * 5);}return storageValue;} else {//缓存非空return cacheValue;}(2)布隆过滤器拦截 如下图所示在访问缓存层和存储层之前将存在的key用布隆过滤器提前保存起来做第一层拦截。例如一个推荐系统有4亿个用户id每个小时算法工程师会根据每个用户之前历史行为计算出推荐数据放到存储层中但是最新的用户由于没有历史行为就会发生缓存穿透的行为为此可以将所有推荐数据的用户做成布隆过滤器。如果布隆过滤器认为该用户id不存在那么就不会访问存储层在一定程度保护了存储层。 这种方法适用于数据命中不高、数据相对固定、实时性低(通常是数据集较大)的应用场景代码维护较为复杂但是缓存空间占用少。 (3)两种方案对比 前面介绍了缓存穿透问题的两种解决方法(实际上这个问题是一个开放问题有很多解决方法)下面通过下表从适用场景和维护成本两个方面对两种方案进行分析。 5雪崩优化 下图描述了什么是缓存雪崩:由于缓存层承载着大量请求有效地保护了存储层但是如果缓存层由于某些原因不能提供服务于是所有的请求都会达到存储层存储层的调用量会暴增造成存储层也会级联宕机的情况。 预防和解决缓存雪崩问题可以从以下三个方面进行着手。 (1)保证缓存层服务高可用性。和飞机都有多个引擎一样如果缓存层设计成高可用的即使个别节点、个别机器、甚至是机房宕掉依然可以提供服务例如Redis Sentinel和Redis Cluster都实现了高可用。 (2)依赖隔离组件为后端限流并降级。无论是缓存层还是存储层都会有出错的概率可以将它们视同为资源。作为并发量较大的系统假如有一个资源不可用可能会造成线程全部阻塞(hang)在这个资源上造成整个系统不可用。降级机制在高并发系统中是非常普遍的比如推荐服务中如果个性化推荐服务不可用可以降级补充热点数据不至于造成前端页面是开天窗。在实际项目中我们需要对重要的资源(例如Redis、MySQL、HBase、外部接口)都进行隔离让每种资源都单独运行在自己的线程池中即使个别资源出现了问题对其他服务没有影响。但是线程池如何管理比如如何关闭资源池、开启资源池、资源池阀值管理这些做起来还是相当复杂的。 (3)提前演练。在项目上线前演练缓存层宕掉后应用以及后端的负载情况以及可能出现的问题在此基础上做一些预案设定。 6热点key重建优化 开发人员使用“缓存过期时间”的策略既可以加速数据读写又保证数据的定期更新这种模式基本能够满足绝大部分需求。但是有两个问题如果同时出现可能就会对应用造成致命的危害 当前key是一个热点key (例如一个热门的娱乐新闻)并发量非常大。 重建缓存不能在短时间完成可能是一个复杂计算例如复杂的SQL、多次IO、多个依赖等。 在缓存失效的瞬间有大量线程来重建缓存造成后端负载加大甚至可能会让应用崩溃。 要解决这个问题也不是很复杂但是不能为了解决这个问题给系统带来更多的麻烦所以需要制定如下目标 减少重建缓存的次数。 数据尽可能一致。 较少的潜在危险。 –互斥锁(mutex key) 此方法只允许一个线程重建缓存其他线程等待重建缓存的线程执行完重新从缓存获取数据即可整个过程如下图所示。 下面代码使用Redis的setnx命令实现上述功能 String get(String key) {//从Redis中获取数据String value redis.get(key);//如果value为空则开始重构缓存if (value null) {//只允许一个线程重构缓存使用nx并设置过期时间exString mutexKey mutext:key: key; if (redis.set(mutexKey,1,ex 180,nx)) {//从数据源获取数据value db.get(key);//回写Redis,并设置过期时间redis.setex(key, timeout, value);//删除key_mutexredis.delete(mutexKey);}//其他线程休息50毫秒后重试else {Thread.sleep(50);get(key);}}return value; }(1)从Redis获取数据如果值不为空则直接返回值否则执行下面的(2.1)和(2.2)步骤。 (2.1)如果set (nx和ex)结果为true说明此时没有其他线程重建缓存那么当前线程执行缓存构建逻辑。 (2.2)如果set (nx和ex)结果为false说明此时已经有其他线程正在执行构建缓存的工作那么当前线程将休息指定时间(例如这里是50毫秒取决于构建缓存的速度)后重新执行函数直到获取到数据。 –永远不过期 “永远不过期”包含两层意思 从缓存层面来看确实没有设置过期时间所以不会出现热点key过期后产生的问题也就是“物理”不过期。 从功能层面来看为每个value设置一个逻辑过期时间当发现超过逻辑过期时间后会使用单独的线程去构建缓存。 整个过程如下图所示。 从实战看此方法有效杜绝了热点key产生的问题但唯一不足的就是重构缓存期间会出现数据不一致的情况这取决于应用方是否容忍这种不一致。 作为一个并发量较大的应用在使用缓存时有三个目标:第一加快用户访问速度提高用户体验。第二降低后端负载减少潜在的风险保证系统平稳。第三保证数据“尽可能”及时更新。下面将按照这三个维度对上述两种解决方案进行分析。 互斥锁(mutex key)这种方案思路比较简单但是存在一定的隐患如果构建缓存过程出现问题或者时间较长可能会存在死锁和线程池阻塞的风险但是这种方法能够较好地降低后端存储负载并在一致性上做得比较好。 “永远不过期”这种方案由于没有设置真正的过期时间实际上已经不存在热点key产生的一系列危害但是会存在数据不一致的情况同时代码复杂度会增大。 两种解决方法对比如下表所示。 总结 (1)缓存的使用带来的收益是能够加速读写降低后端存储负载。 (2)缓存的使用带来的成本是缓存和存储数据不一致性代码维护成本增大架构复杂 度增大。 (3)比较推荐的缓存更新策略是结合剔除、超时、主动更新三种方案共同完成。 (4)穿透问题:使用缓存空对象和布隆过滤器来解决注意它们各自的使用场景和局 限性。 (5)无底洞问题分布式缓存中有更多的机器不保证有更高的性能。有四种批量操作 方式:串行命令、串行I0、并行IO、hash_tag。 (6)雪崩问题缓存层高可用、客户端降级、提前演练是解决雪崩问题的重要方法。 (7)热点key问题斥锁、“永远不过期”能够在一定程度上解决热点key问题开发人员在使用时要了解它们各自的使用成本。