什么叫精度计算结果不超过双精度范围

中南大学 硕士学位论文 双精度64位浮点除法运算单元的设计与实现 姓名:王文广 申请学位级别:硕士 专业:物理电子学 指导教师:曹建 中南大学硕士学位论文 摘要 摘要 浮点数可以表示高精度以及非常大的数值,同时,高精度计算、 图形加速、数字信号处理等应用对浮点处理的要求也越来越高,浮点 运算单元成为当代微处理器中一个重要组成部分。浮点除法因其特殊 性与实现的难度,仍有不小的优化空间,研究表明,浮点运算中除法 运算效率的浮动会导致处理器性能的大幅度浮动,虽然其出现频率较 低,但对处理器整体性能有较大的提高。所以,设计一种执行效率较 高的浮点除法结构对处理器性能的提高可以起到很重要的作用。Nios Ⅱ是一种基于哈佛结构的采用流水线技术的软核RISC处理器,基于 SOPC的思想设计,且专门针对Altera的可编程逻辑器件做了相应优 化。作为一种可配置的通用RISC处理器,它可以与用户自定义逻辑 结合构成SOC系统并下载到Altera的可编程器件中去。浮点运算单 元是为处理器服务的,所以将浮点除法运算单元与Nios II软核处理 器相结合,既能很好的验证运算单元的正确性,又具有很好的实用性。 本文对微处理器中双精度64位浮点除法运算单元的算法与实现进行 了深入的研究。在充分分析现有的各种除法算法,包括Newton 针对微处理中浮点“位除法运算还存在可进一步优化的技术特点, 对SRT-4算法的关键部分商数字选择函数进行了优化,并提出了基于 优化后的SRT-4算法的双精度浮点除法的改进方案。该方案符合 IEEE-754浮点格式标准,采用误差的就近舍入策略,并采用VHDL 硬件描述语言完成了除法运算单元的设计,用SOPCBuilder工具将 运算单元通过Avalon互联架构与NiosII处理器相结合,在基于 FPGA硬件平台上得以实现。同时,对除法运算单元进行了 Cyclone 模块测试与整体验证,结果表明改进的除法运算单元达到了正确性的 设计要求,且具备较快的运行速度,从而具备很好的实用性。 II 中南大学硕士学位论文 can and Floating-pointexpresseshigh-precisionvery v批

}
有经常用显卡做双精度计算的老哥吗?

求问现在支持双精度计算的卡性价比高的有哪些啊?只能上Tesla系列吗?预算最好不要超过1w。。

打算买个将实验室老旧的cpu代码改写成支持gpu,但是都是双精度的计算,是不是上RTX 2080这种游戏卡对这种任务实际上没有大的提升啊?




a卡双精度更强,你可以搜一下数据


最好不要超过1w,性价比高一点的

a卡双精度更强,你可以搜一下数据


我只懂一点cuda,只能用在N卡了

我只懂一点cuda,只能用在N卡了

看资料volta对双精度是有支持的,所以加预算上titanv吧。要么能买到便宜的二手pascal也成



看资料volta对双精度是有支持的,所以加预算上titanv吧。要么能买到便宜的二手pascal也成



我很好奇啥数据一定要双精度,六位有效数字还不够用?




特斯拉帕斯卡也不是1万的事儿啊

我很好奇啥数据一定要双精度,六位有效数字还不够用?


但是a和b都是一个很大很大的数,可能是10的十几二十次方,而且无法解析计算,只能数值求解,这个时候如果计算a和b的精度不够,a - b就会是一个远远大于1的数,最后的结果完全不可信了

从费米时代关注CUDA,现在很少关注了可以买Geforce没有砍双精度显卡

但是a和b都是一个很大很大的数,可能是10的十几二十次方,而且无法解析计算,只能数值求解,这个时候如果计算a和b的精度不够,a - b就会是一个远远大于1的数,最后的结果完全不可信了

首先,我印象里float应该能存到10的三十几次方,就算你的数据量级很大,如果范围不超过1e30,同时除以最小值归一化一下不就行了

其次,数量级大小和精度是两个概念,单精度在1e-6这个精度是肯定没问题的



首先,我印象里float应该能存到10的三十几次方,就算你的数据量级很大,如果范围不超过1e30,同时除以最小值归一化一下不就行了

其次,数量级大小和精度是两个概念,单精度在1e-6这个精度是肯定没问题的


我是这么理解的,很大的数用科学计数法的话就需要对小数点后面的每一个数字尽量精确,这个时候单精度只精确到第六位就不够了

您需要登录后才可以回复,请

}

在所有的操作系统上都可以进行单精度和双精度计算。对于大多数情况来说,单精度计算已经足够,但在下面这些情况下需要使用双精度计算:

(1)计算域非常狭长(比如细长的管道),用单精度表示节点坐标可能不够精确,这时需要采用双精度求解器。

(2)如果计算域是许多由细长管道连接起来的容器,各个容器内的压强各不相同。如果某个容器的压强特别高的话,那么在采用同一个参考压强时,用单精度表示其他容器内压强可能产生较大的误差,这时可以考虑使用双精度求解器。

(3)在涉及到两个区域之间存在很大的热交换,或者网格的长细比很大时,用单精度可能无法正确传递边界信息,并导致计算无法收敛,或精度达不到要求,这时也可以考虑采用双精度求解器。

网格文件是包含各个网格点坐标值和网格连接信息2,以及各分块网格的类型和节点数量等信息的文件

进程文件(journal file)是一个FLUENT 的命令集合,其内容用Scheme 语言写成。可以通过两个途径创建进程文件:一个是在用户进入图形用户界面后,系统自动记录用户的操作和命令输入,自动生成进程文件;另一个是用户使用文本 编辑器直接用Scheme 语言创建进程文件,其工作过程与用FORTRAN 语言编程类似。

系统就开始记录进程文件。此时原来的Start Journa(l 开始进程)菜单项变为Stop Journal(终止进程),点击Stop Journal(终止进程)菜单项则记录过程停止。

边界函数分布文件(profile file)用于定义计算边界上的流场条件,还可以将边界网格写入单独的文件,相应的菜单操作是:

在打开的文件选择窗口中保存文件即可。在用户对网格不满意时,可以先将边界网格保存起来,然后再用Tgrid 软件读入这个网格文件,并重新生成满意的立体网格。

需要注意的是,FLUENT 不支持表面(surface)数据。如果导出的文件中带有指定的表面,那么这样的文件将不能重新导入FLUENT。不过FLUENT 的网格生成软件TGrid 支持表面数据。另外,I-DEAS 软件不支持金字塔型的网格划分方式,所以如果网格中带有金字塔型网格的数据,I-DEAS 将无法识别这样的数据。EnSight6 和结构化FieldViewCase+Data 数据可以用FLUENT 并行版输出。

FLUENT 允许在几何形状确定后,通过插值的方式,在不同网格之间传递数据。比如,可以将六面体网格的计算结果,通过插值转换成混合网格的计算解,然后再利用这个解作为初始解开始混合网格中的计算

在FLUENT 中对下述问题只能使用国际单位制进行输入:

(1)边界函数分布文件。

(4)由外部绘图软件生成的数据。

(5)用户自定义函数(UDF)。

FLUENT 中的“缺省”单位制与国际单位制的唯一区别是角度的单位是“度”,而不是 弧度。

FLUENT 提供三种计算方式,即分离方式、耦合隐式和耦合显式。这三种计算方式都可以给出精确的计算结果,只是针对某些特殊问题时,某种计算方式可能比其它两种方式更快一些。

分离计算和耦合计算的区别在于求解连续、动量、能量和组元方程的方法有所不同。分离方式是分 别求解上面的几个方程,最后得到全部方程的解,耦合方式则是用求解方程组的方式,同时进行计算并最后获得方程的解。两种计算方式的共同点是,在求解附带的 标量方程时,比如计算湍流模型或辐射换热时,都是采用单独求解的方式,就是先求解控制方程,再求解湍流模型方程或辐射方程。显式和隐式的区别在于对方程的

分离方式一般用于不可压流或弱可压流的计算。耦合方式则通常用于高速可压流计算。而在FLUENT 中,两种方式都可以用于可压和不可压流动计算,只是在计算高速可压流时,耦合方式的计算结果更好一些。

FLUENT 求解器的缺省计算方法是分离算法,但是对于高速可压流、彻体力强耦合型

问题(比如浮力问题或旋转流动问题)、超细网格计算问题等类型的问题,最好还是使用耦合隐式计算方式。这个求解器收敛速度更快,只是需要占用更大的内存。

耦合显式计算也是将能量方程与其它方程耦合在一起进行计算,但是所需内存更小,而计算时间则比较长。

只能在分离式求解器中使用的模型:

(2)混合浓度/PDF 燃烧模型。

(4)污染物构成模型。

(7)特定质量流周期流模型。

(8)流向周期性换热模型。

简单地说,可以用三种方法判断计算是否已经收敛:

可以在残差监视器面板中设置Convergence Criterion(收敛判据),比如设为10-3,则残差下降到小于10-3 时,系统既认为计算已经收敛并同时终止计算。

(2)流场变量不再变化。

有时候不论怎样计算,残差都不能降到收敛判据以下。此时可以用具有代表性的流场变量来判断计算是否已经收敛——如果流场变量在经过很多次迭代后不再发生变化,就可以认为计算已经收敛。

(3)总体质量、动量、能量达到平衡。

在Flux Reports(通量报告)面板中检查质量、动量、能量和其他变量的总体平衡情况。通过计算域的净通量应该小于0.1%。

一阶精度格式的缺点是耗散性很大,计算稳定性好,但是对流场中梯度比较大区域内的解有比较严重的“抹平”现象,因此为了获得精度更高的结果,可以采用二阶精度格式。因为二阶精度格式的稳定性不如一阶精度,所以在采用二阶精度格式的时候要适当减小亚松弛因子

通过对一阶精度的计算结果和采用适应性网格、并用二阶精度计算的结果进行对比,可以发现,后 者的耗散性已经大大减小,计算精度得到提高。在FLUENT 中,一阶精度格式是缺省设置的计算格式,在实际计算过程中可以用它获得初始流场,然后再提高计算格式精度,最后采用适应性网格技术。采用这样的计算策略, 既可以保证计算的稳定性,又可以获得精度较高的流场计算结果,因此在复杂流场的计算中是经常使用的办法.

结构网格就是网格拓扑相当于矩形域内均匀网格的网格。为了便于处理物面边界条件,以提高计算精度,常要求结构网格具有贴体性质,即通过坐标变换,使物体的几何边界成为坐标面(线)。现有的结构网格的生成方法基本上可分为以下四大类:

1、代数生成方法。其特点是根据边界上规定的网格点位置,或者附加一些参考点位置,用插值方法确定所有其它网格点的位置。它具有简便灵活、计算速度快的突出优点,但对复杂的几何形状往往难以找到合适的插值函数。

2、保角变换方法。它能生成完全正交的贴体网格,计算机时也少,但局限于二维情况,且对物体形状往往有很大限制。

3、偏微分方程方法。其特点是通过求解偏微分方程的边值问题来确定区域内网格点分布。它具有 较大的适应性,且生成的网格质量很好,特别是椭圆型方程生成的网格通常是光滑和均匀变化的,同时调和函数的极值性质保证了网格生成时物理空间和计算空间之 间的一一对应关系,但网格较密时,一般需要较长的计算机时。

4、变分原理方法。在这类方法中,将生成网格所希望满足的要求表示成某个目标函数(泛函)取极值。这种方法常用于生成自适应网格,因为可以比较方便地将自适应网格的要求用某个变分原理来表示,然后再导出和该变分原理相应的偏微分方程,即Euler 方程。

结构网格总的优点是可以方便准确地处理边界条件,计算精度高,并且可以采用许多高效隐式算法和多重网格法,计算效率也较高。缺点是对复杂外形的网格生成较难,甚至难以实现;即使生成多块结构网格,块与块之间的界面处理又十分复杂,因而在使用上受到限制。

非结构网格就是指这种网格单元和节点彼此没有固定的规律可循,其节点分布完全是任意的。其基 本思想基于这样的假设:任何空间区域都可以被四面体(三维)或三角形(二维)单元所填满,即任何空间区域都可以被四面体或三角形为单元的网格所划分。它有 两种类型:宏观非结构网格和微观非结构网格。

宏观非结构网格是先将空间区域划分成许多小块,每个小块用结构网格划分,再将每个小块网格用 非结构网格连接,合并成总体网格。它在一定程度上可以解复杂边界问题,但块网格拓扑的形成往往需要大量的人工处理,因而不易形成工程实际所需的通用程序; 而且这种网格由于自适应处理会导致网格结构性的彻底破坏,因而也不适合于作网格自适应。

微观非结构网格是完全没有规律的、自由生成的网格,是一种任意的网格。这种网格较结构网格有 如下优点:(1)适合于复杂区域的网格划分,特别对奇性点的处理很简单;(2)其随机的数据结构更易于作网格自适应,以便更好地捕获流场的物理特性; (3)其生成过程不需求解任何方程。因而这类网格目前使用较多。其生成主要有两个环节:(1)如何在计算域内合理分布网格点;(2)如何将网格点有效连 接,形成三角形或四面体网格单元。现有的生成方法很多,但绝大多数都基于De1aunay 原理(二维),最为常用的是以下三种:

1、四叉树(二维)/八叉树(三维)方法

现有的网格自适应方法有再生网格(Remeshing)法、网格加密(Mesh Refinement)法。网格移动(Mesh Movement)法等。再生网格法需要较长的计算机时,而网格移动法又相当复杂,一般采用网格加密法。

1、针对多部件或多体复杂外形的混合网格

2、针对黏性计算的混合网格

3、矩形与非结构混合网格

面网格:Gambit 根据几何形状及CFD 计算的需要提供了三种不同的网格划分方法:

Cooper 方法适合于在一个方向几何相似,而在另两个方向几何较为复杂的实体

对于复杂的工程结构,可以采用Tgrid 方法方法生成四面体和金字塔网格,Tgrid 方法生成网格过程不需要用户干预,可以划分出网格密度变化很大的网格。特别适合计算域很大的外流场。

Wedge Primitive 在一个楔形的尖端划分三角形网格,沿着楔形向外辐射,划分四边形网格

    CAD 中创建的图形要输出为.sat 文件,要满足一定的条件。对于二维图形来说,它必须是一个region,也就是说要求是一个联通域。对于三维图形而言,要求其是一个ASCI body。

FLUENT 对网格文件的操作:

运动或缩放结点坐标,为并行处理分离单元,重新标记区域中的网格单元以减少带宽,以及合并或 分离区域。你可以获得各种各样的网格调试信息,包括内存的使用复杂度、拓扑结构和区域信息。你可以检查出网格中的结点、面和单元数目,决定区域中的最小和 最大单元体,并且可以核查每个单元的合适的结点和面数

}

我要回帖

更多关于 什么叫精度 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信