- 主题:龙芯的指令密度是不是比较低?
我随便编写几个程序看看,龙芯用的指令似乎比较多?是因为之前 MIPS 就是这样的吗?
龙芯的 x86 模拟指令了可以和普通的 la64 指令混起来用吧?也就是说,如果有 x86 的汇编编程经验,可以很快上手的对吧。
这岂不是成了在 la64 上面写 x86 汇编?
--
FROM 47.243.39.*
简单地混起来用肯定不行吧。
不可能十条指令里面夹着两三条这么细粒度的混用。
【 在 hgoldfish 的大作中提到: 】
: 我随便编写几个程序看看,龙芯用的指令似乎比较多?是因为之前 MIPS 就是这样的吗?
: 龙芯的 x86 模拟指令了可以和普通的 la64 指令混起来用吧?也就是说,如果有 x86 的汇编编程经验,可以很快上手的对吧。
: 这岂不是成了在 la64 上面写 x86 汇编?
: ...................
--
FROM 123.122.188.*
啊?还有特殊模式?
龙芯的 x86 模拟指令有什么资料吗?我一直找不到呢。
下载了龙芯的指令集手册,但里面没看到这部分的内容。也没有 SIMD 的内容。
【 在 laputa2013 的大作中提到: 】
: 简单地混起来用肯定不行吧。
: 不可能十条指令里面夹着两三条这么细粒度的混用。
--
修改:hgoldfish FROM 110.84.121.*
FROM 110.84.121.*
指令多可能是优化不够吧?可以在不同架构编译运行同一程序对比下。还可以试下不同优化参数,并match上CPU。
不知道你是用旧世界还是新世界,新世界的话gcc版本需要大于13.1,最好14。旧世界用的不多不太清楚。
我印象里龙芯的x86模拟指令应该现在出的CPU还没有,自3b6600才开始支持(不保证准确)。
SIMD可以搜下“loongarch reference manual”和“Unofficial LoongArch Intrinsics Guide”看看
【 在 hgoldfish 的大作中提到: 】
: 啊?还有特殊模式?
: 龙芯的 x86 模拟指令有什么资料吗?我一直找不到呢。
: 下载了龙芯的指令集手册,但里面没看到这部分的内容。也没有 SIMD 的内容。
: ...................
--
修改:azuresea FROM 112.117.229.*
FROM 112.117.229.*
龙芯的 x86 模拟指令应该是 3a5000 就有的啊。我手头的 3a5000 用 wine 跑 vc6 是可以跑起来的。
【 在 azuresea 的大作中提到: 】
: 指令多可能是优化不够吧?可以在不同架构编译运行同一程序对比下。还可以试下不同优化参数,并match上CPU。
: 不知道你是用旧世界还是新世界,新世界的话gcc版本需要大于13.1,最好14。旧世界用的不多不太清楚。
: 我印象里龙芯的x86模拟指令应该现在出的CPU还没有,自3b6600才开始支持。
: ...................
--
FROM 110.84.121.*
新世界和旧世界的 exe 指令不一样?
那些算术指令不是都只有一份吗?
新世界旧世界最大的区别是内核的加载与初始化方式不一样吧。
我一直用的是官方的 loongnix,旧世界的。
【 在 azuresea 的大作中提到: 】
: 指令多可能是优化不够吧?可以在不同架构编译运行同一程序对比下。还可以试下不同优化参数,并match上CPU。
: 不知道你是用旧世界还是新世界,新世界的话gcc版本需要大于13.1,最好14。旧世界用的不多不太清楚。
: 我印象里龙芯的x86模拟指令应该现在出的CPU还没有,自3b6600才开始支持。
: ...................
--
FROM 110.84.121.*
对,指令都是一样的。
你可以先试下不同优化参数下结果如何。
【 在 hgoldfish 的大作中提到: 】
: 新世界和旧世界的 exe 指令不一样?
: 那些算术指令不是都只有一份吗?
: 新世界旧世界最大的区别是内核的加载与初始化方式不一样吧。
: ...................
--
FROM 112.117.229.*
是可以,但lsx/lasx优化级别的应该没有,这些会在3B6600以后加上(看胡的ppt得出的印象)
【 在 hgoldfish 的大作中提到: 】
: 龙芯的 x86 模拟指令应该是 3a5000 就有的啊。我手头的 3a5000 用 wine 跑 vc6 是可以跑起来的。
:
--
FROM 112.117.229.*
lsx/lasx 优化级别是啥意思啊?
你感觉龙芯这条技术路线,最终能不能实现 100% 效率的 x86 硬件加速啊?
【 在 azuresea 的大作中提到: 】
: 是可以,但lsx/lasx优化级别的应该没有,这些会在3B6600以后加上(看胡的ppt得出的印象)
--
FROM 110.84.121.*
就是x86_64的硬件加速指令直接在龙架构里用类似硬件加速指令直接实现吧,理论上说可以100%效率,但不知会实现多少。
【 在 hgoldfish 的大作中提到: 】
: lsx/lasx 优化级别是啥意思啊?
: 你感觉龙芯这条技术路线,最终能不能实现 100% 效率的 x86 硬件加速啊?
:
--
修改:azuresea FROM 112.117.229.*
FROM 112.117.229.*