Xinhecuican's Blog

函数逼近

基础当我们使用插值时经常遇到一个问题，采样点过多怎么办？采样点如果多余真实函数的次数那么就是方程数多余未知量的数目，这时我们反而无法直接得到精确解。因此需要使用逼近的方法得到近似解。范数为了对线性空间中的元素大小进行衡量，引入了范数的概念。范数的定义： ||x||_n = \sum_{i=1}^{n} (|x_i |^n )^{\frac{1}{n}} 1-范数： $||x||1 = \su

2021-12-06

数学 > 数值计算

光流估计

定义光流在计算机视觉中表示物体的移动,由于相机和物体之间存在相对运动，因此多帧之间的图像像素强度值不同，通过连续检测运动物体帧之间的强度变化，可以估计出物体的运动信息。光流法基本假设条件亮度恒定不变：即同一目标的不同帧之间，亮度不会改变，通过它可以得到光流法的基本方程小范围运动：点在相邻帧之间不会发生大范围的运动光亮恒定不变假设产生的方程为将右侧进行泰勒展开可得 $I_x$为相邻

2022-04-12

计算机图形学

关联规则

引例啤酒与尿布在一家超市里，有一个有趣的现象：尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话，而是发生在美国沃尔玛连锁店超市的真实案例，并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统，为了能够准确了解顾客在其门店的购买习惯，沃尔玛对其顾客的购物行为进行购物篮分析，想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始

2021-06-01

机器学习

乱序处理器

基础本文乱序处理器基于tomasulo算法。指令集为mips，参考书籍为《超标量处理器设计》乱序处理器处理的主要是tomasulo算法中提到的相关，大致可以分为重命名，发射，执行，写回，退休五个阶段。除了这五个阶段外，前端还有取指和译码两个大的阶段。译码译码主要解析出这条指令的rs, rt, rd, src1, src2和aluop。rs和rt是两个源操作数，rd为目的操作数， src1和s

2022-05-05

计算机体系结构

PDede: Partitioned, Deduplicated, Delta Branch Target Buffer

摘要：本篇文章设计了一个新的BTB组织形式，将地址划分为Region，Page，Offset三部分，然后三部分使用不同的表进行存储，从而减小分支目标重复存储的几率。最终ipc提升14.4%，BTB缺失的概率减少54.7%（这性能…）现象 BTB中存在一些重复的目标，浪费了空间跳转的分支占所有分支的超过一半，甚至有些超过三分之二 Region,Page,Offset三部分有不同的空间和时间局部

2024-03-12

论文阅读笔记

向量处理器和gpu

向量处理器传统的处理器每一条指令只能针对一个数据执行加减乘除等操作，而向量指令可以在一条指令中实现对多个数据进行操作。 RV64V的主要构成为：向量寄存器：供32项，每一项包含32个64位元素。向量寄存器至少有16个读端口和8个写端口。为了实现大带宽，通常做法为使用多个存储体来组成寄存器堆向量功能单元：包括加减乘除，逻辑运算，浮点运算等单元，所有单元都是完全流水化的向量存储/载入单元：

2023-09-03

计算机体系结构

A Scalable Front-End Architecture for Fast Instruction Delivery

简介一个非常经典且现在都在使用的流水线前端架构。它的特点是将分支预测放在流水线的最前端，和取指进行了结构。将ICache移出了关键路径。结构部件介绍： FTQ：用来缓存分支预测器提供的预测地址，分支预测器会不停的预测并提交地址给FTQ，然后Icache从FTQ中获得取指地址并进行取指 FTB(fetch target buffer): 包括分支预测器，btb等 FTBFTB是该设计的核心

2023-09-27

论文阅读笔记

sparql和cpyher

sparql原文链接 12345678910111213141516171819SELECT [DISTINCT] <variable1> [<variable2> ...][FROM ...]WHERE{ triple pattern 1. [triple pattern 2.] ... [附加条件...]}[OFFSET 数字

2023-09-20

Branch Runahead: An Alternative to Branch Prediction for Impossible to Predict Branches

介绍论文原文 tage-sc-l分支预测器在大多数问题上都有很高的准确率，但是对于数据依赖型的分支却无能为力。例如判断一个数组中的某个数据是否为0，它依赖于数组的值，现有分支预测器都是基于过去分支的历史进行的，二者没有相关性，因此无法预测。本文提出了一种提前执行分支指令的方法，通过一个小的处理器提前计算出分支结果，来处理分支预测器无法预测数据依赖型分支的问题依赖链的计算守护分支和影响分支想要提

2023-09-17

论文阅读笔记

gpu存储架构

本篇是《通用图形处理器设计-GPGPU编程模型与架构原理》的阅读笔记 gpu处理器架构 gpu存储结构简介 gpu存储和cpu截然不同，呈现倒三角的结构。gpu使用如此多的寄存器文件主要是为了线程束的零开销切换。因为每个线程束都有它自己的寄存器，因此每次切换线程束时就不需要像cpu线程切换时那样将寄存器存入内存再读取了。大容量寄存器带来的一个负面影响是L1和L2缓存的容量被大量挤压，在Pasca

2023-09-11

计算机体系结构