对于9.1的cu,我尝试了len=1111111时,核函数的结果是不对的,最后一个block的输出结果不正确。具体看了下核函数的内容,是for循环中的if判断的第二个条件有问题,应该是bid*bdim +index + s < len。