上位机软件开发技术总结:数据采集方向

1. 数据采集的基础概念

1.1 数据采集系统概述

数据采集(Data Acquisition,简称DAQ)是从真实世界获取测量信息并将其转换为可供计算机处理的数字信号的过程。在工程实践中,上位机软件作为数据采集系统的核心组件,负责配置采集设备、接收数据、处理数据并进行可视化与存储。

一个完整的数据采集系统通常包括:

  • 传感器与信号调理
  • 数据采集硬件
  • 数据传输通道
  • 上位机数据采集软件
  • 数据存储与分析系统

1.2 数据采集的关键指标

开发数据采集系统时,需要考虑以下关键性能指标:

  1. 采样率(Sample Rate):每秒钟采集的样本数,单位为Hz或S/s
  2. 分辨率(Resolution):ADC位数,决定测量精度,常见有12位、16位、24位等
  3. 通道数(Channel Count):同时采集的信号通道数量
  4. 带宽(Bandwidth):系统能够处理的最高信号频率
  5. 延迟(Latency):从信号输入到数据可用的时间延迟
  6. 信噪比(SNR):有效信号与噪声的比值,用于评估信号质量
  7. 实时性(Real-time Performance):系统响应和处理速度

1.3 数据采集的主要挑战

在实际开发过程中,数据采集系统面临多种挑战:

  1. 高速数据处理:处理海量数据时保持系统稳定性
  2. 同步采集:确保多通道数据的时间一致性
  3. 噪声抑制:滤除外部干扰和系统噪声
  4. 实时响应:在时间关键型应用中保证低延迟
  5. 可靠性:长时间稳定运行,避免数据丢失
  6. 数据完整性:确保采集的数据准确无误

2. 数据采集上位机软件架构

2.1 典型架构模式

数据采集上位机软件通常采用多层架构设计:

  1. 硬件抽象层:封装不同硬件设备的接口差异,提供统一访问方式
  2. 数据采集层:负责数据采集配置、控制和原始数据接收
  3. 数据处理层:进行数据过滤、转换、校准和压缩等处理
  4. 数据存储层:管理数据的持久化存储和检索
  5. 应用逻辑层:实现业务逻辑和高级分析功能
  6. 用户界面层:提供数据可视化和用户交互界面

2.2 设计模式应用

在数据采集软件开发中,常用的设计模式包括:

  • 观察者模式:用于数据变化通知,实现数据采集与处理、显示的解耦
  • 命令模式:封装对硬件的操作请求,支持操作排队、日志和撤销
  • 状态模式:管理采集系统的不同状态(配置、采集、暂停、停止)
  • 策略模式:封装不同的数据处理算法,支持运行时算法切换
  • 适配器模式:统一不同硬件设备的接口,简化上层应用开发
  • 工厂模式:创建适用于不同设备的采集驱动实例
  • 单例模式:确保设备管理器、配置管理器等关键组件的唯一性

2.3 多线程架构

数据采集系统往往采用多线程架构来满足性能需求:

┌───────────────────┐    ┌───────────────────┐    ┌───────────────────┐
│  采集线程         │    │  处理线程         │    │  存储线程         │
│  - 配置硬件       │    │  - 缓冲区管理     │    │  - 文件I/O        │
│  - 读取原始数据   │──→│  - 信号处理       │──→│  - 数据库操作     │
│  - 时间戳添加     │    │  - 数据转换       │    │  - 网络传输       │
└───────────────────┘    └───────────────────┘    └───────────────────┘
           ↑                       ↑                       ↑
           │                       │                       │
           └───────────────────────┼───────────────────────┘
                                   │
                         ┌───────────────────┐
                         │  UI线程           │
                         │  - 用户交互       │
                         │  - 实时显示       │
                         │  - 控制命令       │
                         └───────────────────┘

3. 数据采集接口与通信协议

3.1 常用通信接口

数据采集系统使用多种接口与设备通信:

  1. USB:广泛应用于中低速数据采集,方便连接
  2. 串口(RS-232/RS-485):工业环境中常用,抗干扰性好
  3. 以太网:适合远距离、高带宽应用
  4. PCI/PCIe:直接连接主板,提供最高带宽
  5. GPIB(IEEE-488):传统实验室仪器接口
  6. CAN总线:常用于汽车和工业自动化环境
  7. 蓝牙/WiFi:无线数据采集解决方案
  8. 专用接口:如PCIE、LXI等仪器专用接口

3.2 通信协议实现

以下是几种常见协议的C++实现示例:

Modbus RTU协议示例

cpp

/**
 * modbus_rtu.cpp - Modbus RTU协议实现
 * 用于工业环境中的数据采集
 */
#include <iostream>
#include <vector>
#include <string>
#include <stdint.h>
#include <chrono>
#include <thread>
#include <cstring>

// Modbus功能码
enum ModbusFunctionCode {
    READ_COILS = 0x01,
    READ_DISCRETE_INPUTS = 0x02,
    READ_HOLDING_REGISTERS = 0x03,
    READ_INPUT_REGISTERS = 0x04,
    WRITE_SINGLE_COIL = 0x05,
    WRITE_SINGLE_REGISTER = 0x06,
    WRITE_MULTIPLE_COILS = 0x0F,
    WRITE_MULTIPLE_REGISTERS = 0x10
};

class ModbusRTU {
public:
    ModbusRTU(const std::string& portName) : portName_(portName), connected_(false) {}
    
    ~ModbusRTU() {
        if (connected_) {
            disconnect();
        }
    }
    
    // 连接到串口
    bool connect(int baudRate = 9600, int dataBits = 8, char parity = 'N', int stopBits = 1) {
        // 实际应用中,这里需要使用平台相关的串口库
        std::cout << "Connecting to " << portName_ << " at " << baudRate << " baud" << std::endl;
        // 模拟连接操作
        std::this_thread::sleep_for(std::chrono::milliseconds(100));
        connected_ = true;
        return connected_;
    }
    
    // 断开连接
    void disconnect() {
        if (!connected_) return;
        std::cout << "Disconnecting from " << portName_ << std::endl;
        connected_ = false;
    }
    
    // 读取保持寄存器
    std::vector<uint16_t> readHoldingRegisters(uint8_t slaveAddress, uint16_t startAddress, uint16_t quantity) {
        std::vector<uint16_t> values;
        if (!connected_) {
            std::cerr << "Not connected to device" << std::endl;
            return values;
        }
        
        // 构建请求帧
        std::vector<uint8_t> request = buildRequest(slaveAddress, READ_HOLDING_REGISTERS, startAddress, quantity);
        
        // 发送请求并接收响应
        std::vector<uint8_t> response = sendRequest(request);
        
        // 检查响应的有效性
        if (!isValidResponse(response, slaveAddress, READ_HOLDING_REGISTERS)) {
            std::cerr << "Invalid response received" << std::endl;
            return values;
        }
        
        // 解析响应数据
        size_t byteCount = response[2];
        for (size_t i = 0; i < byteCount; i += 2) {
            if (i + 3 < response.size()) {
                uint16_t value = (response[i + 3] << 8) | response[i + 4];
                values.push_back(value);
            }
        }
        
        return values;
    }
    
    // 写入单个寄存器
    bool writeSingleRegister(uint8_t slaveAddress, uint16_t address, uint16_t value) {
        if (!connected_) {
            std::cerr << "Not connected to device" << std::endl;
            return false;
        }
        
        // 构建请求帧
        std::vector<uint8_t> request = buildRequest(slaveAddress, WRITE_SINGLE_REGISTER, address, value);
        
        // 发送请求并接收响应
        std::vector<uint8_t> response = sendRequest(request);
        
        // 检查响应的有效性
        return isValidResponse(response, slaveAddress, WRITE_SINGLE_REGISTER);
    }
    
private:
    // 构建Modbus请求帧
    std::vector<uint8_t> buildRequest(uint8_t slaveAddress, uint8_t functionCode, 
                                     uint16_t address, uint16_t value) {
        std::vector<uint8_t> frame;
        
        // 从站地址
        frame.push_back(slaveAddress);
        
        // 功能码
        frame.push_back(functionCode);
        
        // 寄存器地址(高字节在前)
        frame.push_back((address >> 8) & 0xFF);
        frame.push_back(address & 0xFF);
        
        // 数据(根据功能码不同而不同)
        if (functionCode == READ_HOLDING_REGISTERS || functionCode == READ_INPUT_REGISTERS) {
            // 寄存器数量
            frame.push_back((value >> 8) & 0xFF);
            frame.push_back(value & 0xFF);
        } else if (functionCode == WRITE_SINGLE_REGISTER) {
            // 寄存器值
            frame.push_back((value >> 8) & 0xFF);
            frame.push_back(value & 0xFF);
        }
        
        // 计算CRC
        uint16_t crc = calculateCRC(frame);
        frame.push_back(crc & 0xFF);         // CRC低字节
        frame.push_back((crc >> 8) & 0xFF);  // CRC高字节
        
        return frame;
    }
    
    // 发送请求并接收响应
    std::vector<uint8_t> sendRequest(const std::vector<uint8_t>& request) {
        // 模拟发送请求
        std::cout << "Sending Modbus request: ";
        for (uint8_t byte : request) {
            printf("%02X ", byte);
        }
        std::cout << std::endl;
        
        // 模拟延迟
        std::this_thread::sleep_for(std::chrono::milliseconds(20));
        
        // 模拟响应(实际应用中需要从串口读取)
        std::vector<uint8_t> response;
        
        // 模拟一个读保持寄存器的响应
        if (request.size() >= 2 && request[1] == READ_HOLDING_REGISTERS) {
            uint8_t slaveAddress = request[0];
            uint8_t byteCount = 4;  // 模拟读取2个寄存器
            
            response.push_back(slaveAddress);
            response.push_back(READ_HOLDING_REGISTERS);
            response.push_back(byteCount);
            
            // 模拟寄存器值
            response.push_back(0x00);  // 第一个寄存器高字节
            response.push_back(0x0A);  // 第一个寄存器低字节
            response.push_back(0x00);  // 第二个寄存器高字节
            response.push_back(0x0B);  // 第二个寄存器低字节
            
            // 计算CRC
            uint16_t crc = calculateCRC(response);
            response.push_back(crc & 0xFF);
            response.push_back((crc >> 8) & 0xFF);
        }
        else if (request.size() >= 2 && request[1] == WRITE_SINGLE_REGISTER) {
            // 写入成功的响应通常是请求的回显
            response = request;
        }
        
        std::cout << "Received response: ";
        for (uint8_t byte : response) {
            printf("%02X ", byte);
        }
        std::cout << std::endl;
        
        return response;
    }
    
    // 检查响应的有效性
    bool isValidResponse(const std::vector<uint8_t>& response, uint8_t expectedAddress, uint8_t expectedFunction) {
        // 检查响应的基本长度
        if (response.size() < 5) {
            return false;
        }
        
        // 检查从站地址和功能码
        if (response[0] != expectedAddress || response[1] != expectedFunction) {
            return false;
        }
        
        // 检查CRC
        size_t dataLen = response.size() - 2;
        uint16_t receivedCrc = (response[response.size() - 1] << 8) | response[response.size() - 2];
        uint16_t calculatedCrc = calculateCRC(std::vector<uint8_t>(response.begin(), response.begin() + dataLen));
        
        return receivedCrc == calculatedCrc;
    }
    
    // 计算Modbus CRC
    uint16_t calculateCRC(const std::vector<uint8_t>& data) {
        uint16_t crc = 0xFFFF;
        
        for (size_t i = 0; i < data.size(); i++) {
            crc ^= data[i];
            
            for (int j = 0; j < 8; j++) {
                if (crc & 0x0001) {
                    crc = (crc >> 1) ^ 0xA001;
                } else {
                    crc = crc >> 1;
                }
            }
        }
        
        return crc;
    }
    
private:
    std::string portName_;
    bool connected_;
};
MQTT协议数据采集示例

cpp

/**
 * mqtt_data_acquisition.cpp - 使用MQTT协议的数据采集实现
 * 适用于物联网环境中的分布式数据采集
 */
#include <iostream>
#include <string>
#include <functional>
#include <thread>
#include <chrono>
#include <atomic>
#include <vector>
#include <map>
#include <mutex>
#include <condition_variable>
#include <queue>

// 模拟MQTT客户端类
class MqttClient {
public:
    using MessageCallback = std::function<void(const std::string&, const std::string&)>;
    
    MqttClient(const std::string& clientId) 
        : clientId_(clientId), connected_(false), running_(false) {}
    
    ~MqttClient() {
        if (connected_) {
            disconnect();
        }
    }
    
    // 连接到MQTT代理服务器
    bool connect(const std::string& host, int port = 1883, 
                const std::string& username = "", const std::string& password = "") {
        if (connected_) {
            return true;
        }
        
        std::cout << "Connecting to MQTT broker at " << host << ":" << port << std::endl;
        // 实际应用中,这里需要使用MQTT客户端库连接服务器
        
        // 模拟连接过程
        std::this_thread::sleep_for(std::chrono::milliseconds(500));
        
        connected_ = true;
        running_ = true;
        
        // 启动消息处理线程
        messageThread_ = std::thread(&MqttClient::messageLoop, this);
        
        std::cout << "Connected to MQTT broker: " << clientId_ << std::endl;
        return true;
    }
    
    // 断开连接
    void disconnect() {
        if (!connected_) {
            return;
        }
        
        std::cout << "Disconnecting from MQTT broker: " << clientId_ << std::endl;
        
        running_ = false;
        connected_ = false;
        
        // 等待消息处理线程结束
        messageCondition_.notify_all();
        if (messageThread_.joinable()) {
            messageThread_.join();
        }
        
        std::cout << "Disconnected from MQTT broker" << std::endl;
    }
    
    // 发布消息
    bool publish(const std::string& topic, const std::string& message, int qos = 0, bool retain = false) {
        if (!connected_) {
            std::cerr << "Not connected to MQTT broker" << std::endl;
            return false;
        }
        
        std::cout << "Publishing to " << topic << ": " << message << std::endl;
        
        // 模拟消息发布
        // 实际应用中,这里需要使用MQTT客户端库发布消息
        std::this_thread::sleep_for(std::chrono::milliseconds(10));
        
        return true;
    }
    
    // 订阅主题
    bool subscribe(const std::string& topic, int qos = 0) {
        if (!connected_) {
            std::cerr << "Not connected to MQTT broker" << std::endl;
            return false;
        }
        
        std::cout << "Subscribing to topic: " << topic << std::endl;
        
        std::lock_guard<std::mutex> lock(subscriptionsMutex_);
        subscriptions_[topic] = qos;
        
        // 模拟订阅过程
        std::this_thread::sleep_for(std::chrono::milliseconds(50));
        
        // 模拟收到一些初始数据
        queueMessage(topic, "Initial data for " + topic);
        
        return true;
    }
    
    // 取消订阅
    bool unsubscribe(const std::string& topic) {
        if (!connected_) {
            std::cerr << "Not connected to MQTT broker" << std::endl;
            return false;
        }
        
        std::cout << "Unsubscribing from topic: " << topic << std::endl;
        
        std::lock_guard<std::mutex> lock(subscriptionsMutex_);
        subscriptions_.erase(topic);
        
        return true;
    }
    
    // 设置消息回调函数
    void setMessageCallback(MessageCallback callback) {
        messageCallback_ = callback;
    }
    
private:
    // 消息处理线程的主循环
    void messageLoop() {
        while (running_) {
            // 等待消息或超时
            std::unique_lock<std::mutex> lock(messageQueueMutex_);
            messageCondition_.wait_for(lock, std::chrono::milliseconds(100), 
                                     [this] { return !running_ || !messageQueue_.empty(); });
            
            if (!running_) {
                break;
            }
            
            // 处理队列中的消息
            while (!messageQueue_.empty()) {
                auto& msg = messageQueue_.front();
                
                // 调用消息回调函数
                if (messageCallback_) {
                    messageCallback_(msg.first, msg.second);
                }
                
                messageQueue_.pop();
            }
        }
    }
    
    // 将消息加入队列
    void queueMessage(const std::string& topic, const std::string& payload) {
        {
            std::lock_guard<std::mutex> lock(messageQueueMutex_);
            messageQueue_.push(std::make_pair(topic, payload));
        }
        messageCondition_.notify_one();
    }
    
private:
    std::string clientId_;
    bool connected_;
    std::atomic<bool> running_;
    std::thread messageThread_;
    std::mutex subscriptionsMutex_;
    std::map<std::string, int> subscriptions_;
    std::mutex messageQueueMutex_;
    std::condition_variable messageCondition_;
    std::queue<std::pair<std::string, std::string>> messageQueue_;
    MessageCallback messageCallback_;
};

// 数据采集器类
class MqttDataAcquisition {
public:
    MqttDataAcquisition(const std::string& clientId) 
        : mqttClient_(clientId), samplingInterval_(1000), running_(false) {
        
        // 设置MQTT消息回调
        mqttClient_.setMessageCallback([this](const std::string& topic, const std::string& payload) {
            handleMessage(topic, payload);
        });
    }
    
    ~MqttDataAcquisition() {
        stop();
    }
    
    // 连接到MQTT代理服务器
    bool connect(const std::string& host, int port = 1883) {
        return mqttClient_.connect(host, port);
    }
    
    // 断开连接
    void disconnect() {
        mqttClient_.disconnect();
    }
    
    // 添加数据源
    void addDataSource(const std::string& sourceTopic, const std::string& sourceType) {
        std::lock_guard<std::mutex> lock(dataSourcesMutex_);
        
        // 添加数据源信息
        DataSource source;
        source.topic = sourceTopic;
        source.type = sourceType;
        
        dataSources_[sourceTopic] = source;
        
        // 订阅该主题
        mqttClient_.subscribe(sourceTopic);
        
        std::cout << "Added data source: " << sourceTopic << " (" << sourceType << ")" << std::endl;
    }
    
    // 移除数据源
    void removeDataSource(const std::string& sourceTopic) {
        std::lock_guard<std::mutex> lock(dataSourcesMutex_);
        
        // 删除该数据源
        dataSources_.erase(sourceTopic);
        
        // 取消订阅
        mqttClient_.unsubscribe(sourceTopic);
        
        std::cout << "Removed data source: " << sourceTopic << std::endl;
    }
    
    // 开始周期性数据发布(模拟数据生成)
    void start() {
        if (running_) {
            return;
        }
        
        running_ = true;
        publisherThread_ = std::thread(&MqttDataAcquisition::publisherLoop, this);
        
        std::cout << "Started periodic data publishing" << std::endl;
    }
    
    // 停止周期性数据发布
    void stop() {
        if (!running_) {
            return;
        }
        
        running_ = false;
        
        if (publisherThread_.joinable()) {
            publisherThread_.join();
        }
        
        std::cout << "Stopped periodic data publishing" << std::endl;
    }
    
    // 设置采样间隔(毫秒)
    void setSamplingInterval(int interval) {
        if (interval < 100) interval = 100;  // 最小间隔为100ms
        samplingInterval_ = interval;
        std::cout << "Sampling interval set to " << interval << " ms" << std::endl;
    }
    
    // 获取最新数据
    std::string getLatestData(const std::string& sourceTopic) {
        std::lock_guard<std::mutex> lock(dataValuesMutex_);
        
        auto it = dataValues_.find(sourceTopic);
        if (it != dataValues_.end()) {
            return it->second;
        }
        
        return "";
    }
    
    // 获取所有最新数据
    std::map<std::string, std::string> getAllLatestData() {
        std::lock_guard<std::mutex> lock(dataValuesMutex_);
        return dataValues_;
    }
    
private:
    // 处理接收到的MQTT消息
    void handleMessage(const std::string& topic, const std::string& payload) {
        std::lock_guard<std::mutex> lock(dataValuesMutex_);
        
        // 存储数据值
        dataValues_[topic] = payload;
        
        std::cout << "Received data from " << topic << ": " << payload << std::endl;
    }
    
    // 模拟数据发布线程
    void publisherLoop() {
        while (running_) {
            // 发布模拟数据
            {
                std::lock_guard<std::mutex> lock(dataSourcesMutex_);
                
                for (const auto& source : dataSources_) {
                    std::string topic = source.first;
                    std::string type = source.second.type;
                    
                    // 生成模拟数据
                    std::string data = generateSimulatedData(type);
                    
                    // 发布数据
                    mqttClient_.publish(topic + "/data", data);
                }
            }
            
            // 等待下一个采样周期
            std::this_thread::sleep_for(std::chrono::milliseconds(samplingInterval_));
        }
    }
    
    // 生成模拟数据
    std::string generateSimulatedData(const std::string& type) {
        if (type == "temperature") {
            // 生成20到30度之间的温度数据
            double temp = 20.0 + (rand() % 100) / 10.0;
            return std::to_string(temp);
        }
        else if (type == "humidity") {
            // 生成40%到60%之间的湿度数据
            int humidity = 40 + (rand() % 20);
            return std::to_string(humidity);
        }
        else if (type == "pressure") {
            // 生成1000到1020百帕之间的气压数据
            double pressure = 1000.0 + (rand() % 200) / 10.0;
            return std::to_string(pressure);
        }
        else {
            // 默认为随机整数
            return std::to_string(rand() % 100);
        }
    }
    
private:
    // 数据源结构
    struct DataSource {
        std::string topic;
        std::string type;
    };
    
    MqttClient mqttClient_;
    std::map<std::string, DataSource> dataSources_;
    std::mutex dataSourcesMutex_;
    std::map<std::string, std::string> dataValues_;
    std::mutex dataValuesMutex_;
    int samplingInterval_;
    std::atomic<bool> running_;
    std::thread publisherThread_;
};

// 示例使用代码
int main() {
    // 创建数据采集器
    MqttDataAcquisition acquisition("SensorGateway1");
    
    // 连接到MQTT服务器
    if (!acquisition.connect("localhost", 1883)) {
        std::cerr << "Failed to connect to MQTT broker" << std::endl;
        return 1;
    }
    
    // 添加数据源
    acquisition.addDataSource("sensors/temperature", "temperature");
    acquisition.addDataSource("sensors/humidity", "humidity");
    acquisition.addDataSource("sensors/pressure", "pressure");
    
    // 设置采样间隔为2秒
    acquisition.setSamplingInterval(2000);
    
    // 开始采集
    acquisition.start();
    
    // 运行10秒后获取数据
    std::cout << "Running data acquisition for 10 seconds..." << std::endl;
    std::this_thread::sleep_for(std::chrono::seconds(10));
    
    // 获取并显示所有最新数据
    auto latestData = acquisition.getAllLatestData();
    std::cout << "\nLatest data values:" << std::endl;
    for (const auto& data : latestData) {
        std::cout << data.first << ": " << data.second << std::endl;
    }
    
    // 停止采集
    acquisition.stop();
    
    // 断开连接
    acquisition.disconnect();
    
    return 0;
}

4. 缓冲策略与数据流管理

4.1 数据采集缓冲区设计

在高速数据采集系统中,有效的缓冲区管理至关重要,主要缓冲策略包括:

  1. 环形缓冲区(Ring Buffer)

    • 固定大小的循环数组,适合连续数据流
    • 写入覆盖最旧数据,避免缓冲区溢出
    • 实现高效的生产者-消费者模式
  2. 双缓冲区(Double Buffering)

    • 两个交替使用的缓冲区
    • 一个用于采集,一个用于处理
    • 避免数据丢失,减少锁争用
  3. 多级缓冲区(Multi-level Buffering)

    • 根据数据处理阶段设计多级缓冲
    • 各阶段使用适当大小的缓冲区
    • 优化整体系统吞吐量和延迟

4.2 高性能环形缓冲区实现

以下是一个线程安全的高性能环形缓冲区实现:

cpp

/**
 * ring_buffer.h - 线程安全的环形缓冲区实现
 * 用于高速数据采集系统中的数据流管理
 */
#ifndef RING_BUFFER_H
#define RING_BUFFER_H

#include <vector>
#include <mutex>
#include <condition_variable>
#include <atomic>
#include <stdexcept>
#include <cstring>

template<typename T>
class RingBuffer {
public:
    // 构造函数,创建指定容量的环形缓冲区
    explicit RingBuffer(size_t capacity) 
        : buffer_(capacity), capacity_(capacity), 
          head_(0), tail_(0), size_(0), overflow_(false) {
        if (capacity == 0) {
            throw std::invalid_argument("Ring buffer capacity must be greater than 0");
        }
    }
    
    // 清空缓冲区
    void clear() {
        std::lock_guard<std::mutex> lock(mutex_);
        head_ = 0;
        tail_ = 0;
        size_ = 0;
        overflow_ = false;
    }
    
    // 写入单个元素
    bool write(const T& item) {
        std::lock_guard<std::mutex> lock(mutex_);
        
        // 将元素放入缓冲区
        buffer_[head_] = item;
        
        // 更新头指针
        head_ = (head_ + 1) % capacity_;
        
        // 如果缓冲区已满,移动尾指针(覆盖最旧的数据)
        if (size_ == capacity_) {
            tail_ = (tail_ + 1) % capacity_;
            overflow_ = true;  // 设置溢出标志
        } else {
            size_++;
        }
        
        // 通知等待的读取者
        condition_.notify_one();
        
        return true;
    }
    
    // 批量写入元素
    size_t write(const T* items, size_t count) {
        if (count == 0) return 0;
        
        std::lock_guard<std::mutex> lock(mutex_);
        
        // 处理特殊情况:写入数量大于缓冲区容量
        if (count >= capacity_) {
            // 只保留最后capacity_个元素
            items += (count - capacity_);
            count = capacity_;
            
            // 直接复制到缓冲区
            for (size_t i = 0; i < count; i++) {
                buffer_[i] = items[i];
            }
            
            head_ = 0;
            tail_ = 0;
            size_ = capacity_;
            overflow_ = true;
        } else {
            // 正常写入
            size_t first_batch = std::min(count, capacity_ - head_);
            
            // 复制第一批数据
            for (size_t i = 0; i < first_batch; i++) {
                buffer_[head_ + i] = items[i];
            }
            
            // 如果需要环绕,复制剩余数据
            if (first_batch < count) {
                for (size_t i = 0; i < count - first_batch; i++) {
                    buffer_[i] = items[first_batch + i];
                }
            }
            
            // 更新头指针
            head_ = (head_ + count) % capacity_;
            
            // 更新大小和尾指针
            if (size_ + count > capacity_) {
                size_t overflow_count = size_ + count - capacity_;
                tail_ = (tail_ + overflow_count) % capacity_;
                size_ = capacity_;
                overflow_ = true;
            } else {
                size_ += count;
            }
        }
        
        // 通知等待的读取者
        condition_.notify_all();
        
        return count;
    }
    
    // 读取单个元素
    bool read(T& item) {
        std::unique_lock<std::mutex> lock(mutex_);
        
        // 如果缓冲区为空,则读取失败
        if (size_ == 0) {
            return false;
        }
        
        // 获取尾部元素
        item = buffer_[tail_];
        
        // 更新尾指针
        tail_ = (tail_ + 1) % capacity_;
        size_--;
        
        return true;
    }
    
    // 阻塞式读取单个元素
    bool read(T& item, int timeout_ms) {
        std::unique_lock<std::mutex> lock(mutex_);
        
        // 等待数据可用或超时
        if (timeout_ms > 0) {
            if (!condition_.wait_for(lock, std::chrono::milliseconds(timeout_ms), 
                                   [this] { return size_ > 0; })) {
                return false;  // 超时
            }
        } else {
            condition_.wait(lock, [this] { return size_ > 0; });
        }
        
        // 获取尾部元素
        item = buffer_[tail_];
        
        // 更新尾指针
        tail_ = (tail_ + 1) % capacity_;
        size_--;
        
        return true;
    }
    
    // 批量读取元素,返回实际读取的元素数量
    size_t read(T* items, size_t max_count) {
        std::lock_guard<std::mutex> lock(mutex_);
        
        // 不能读取超过当前可用数量
        size_t count = std::min(max_count, size_);
        if (count == 0) return 0;
        
        // 第一段连续数据长度
        size_t first_batch = std::min(count, capacity_ - tail_);
        
        // 复制第一段数据
        for (size_t i = 0; i < first_batch; i++) {
            items[i] = buffer_[tail_ + i];
        }
        
        // 如果需要环绕,复制剩余数据
        if (first_batch < count) {
            for (size_t i = 0; i < count - first_batch; i++) {
                items[first_batch + i] = buffer_[i];
            }
        }
        
        // 更新尾指针
        tail_ = (tail_ + count) % capacity_;
        size_ -= count;
        
        return count;
    }
    
    // 阻塞式批量读取元素,返回实际读取的元素数量
    size_t read(T* items, size_t max_count, int timeout_ms) {
        std::unique_lock<std::mutex> lock(mutex_);
        
        // 等待数据可用或超时
        if (timeout_ms > 0) {
            if (!condition_.wait_for(lock, std::chrono::milliseconds(timeout_ms), 
                                   [this] { return size_ > 0; })) {
                return 0;  // 超时
            }
        } else {
            condition_.wait(lock, [this] { return size_ > 0; });
        }
        
        // 读取可用数据
        size_t count = std::min(max_count, size_);
        if (count == 0) return 0;
        
        // 第一段连续数据长度
        size_t first_batch = std::min(count, capacity_ - tail_);
        
        // 复制第一段数据
        for (size_t i = 0; i < first_batch; i++) {
            items[i] = buffer_[tail_ + i];
        }
        
        // 如果需要环绕,复制剩余数据
        if (first_batch < count) {
            for (size_t i = 0; i < count - first_batch; i++) {
                items[first_batch + i] = buffer_[i];
            }
        }
        
        // 更新尾指针
        tail_ = (tail_ + count) % capacity_;
        size_ -= count;
        
        return count;
    }
    
    // 查看下一个元素但不移除
    bool peek(T& item) const {
        std::lock_guard<std::mutex> lock(mutex_);
        
        if (size_ == 0) {
            return false;
        }
        
        item = buffer_[tail_];
        return true;
    }
    
    // 获取当前缓冲区大小
    size_t size() const {
        std::lock_guard<std::mutex> lock(mutex_);
        return size_;
    }
    
    // 获取缓冲区容量
    size_t capacity() const {
        return capacity_;
    }
    
    // 检查缓冲区是否为空
    bool empty() const {
        std::lock_guard<std::mutex> lock(mutex_);
        return size_ == 0;
    }
    
    // 检查缓冲区是否已满
    bool full() const {
        std::lock_guard<std::mutex> lock(mutex_);
        return size_ == capacity_;
    }
    
    // 检查缓冲区是否曾经溢出
    bool hasOverflowed() const {
        std::lock_guard<std::mutex> lock(mutex_);
        return overflow_;
    }
    
    // 重置溢出标志
    void resetOverflowFlag() {
        std::lock_guard<std::mutex> lock(mutex_);
        overflow_ = false;
    }
    
private:
    std::vector<T> buffer_;       // 缓冲区数据
    const size_t capacity_;       // 缓冲区容量
    size_t head_;                 // 下一个写入位置
    size_t tail_;                 // 下一个读取位置
    size_t size_;                 // 当前元素数量
    bool overflow_;               // 溢出标志
    mutable std::mutex mutex_;    // 用于线程同步的互斥锁
    std::condition_variable condition_; // 条件变量,用于阻塞读取
};

#endif // RING_BUFFER_H

4.3 双缓冲区实现数据流管理

cpp

/**
 * double_buffer.h - 双缓冲区实现
 * 适合需要连续处理而不丢失数据的采集系统
 */
#ifndef DOUBLE_BUFFER_H
#define DOUBLE_BUFFER_H

#include <vector>
#include <mutex>
#include <atomic>
#include <algorithm>

template<typename T>
class DoubleBuffer {
public:
    // 构造函数,创建指定容量的双缓冲区
    explicit DoubleBuffer(size_t buffer_size) 
        : buffer_a_(buffer_size), buffer_b_(buffer_size),
          size_a_(0), size_b_(0), 
          active_buffer_(&buffer_a_), process_buffer_(&buffer_b_),
          active_size_(&size_a_), process_size_(&size_b_),
          is_swapping_(false) {
    }
    
    // 向活动缓冲区写入数据
    size_t write(const T* data, size_t count) {
        // 等待任何交换操作完成
        while (is_swapping_.load(std::memory_order_acquire)) {
            // 自旋等待或让出时间片
            std::this_thread::yield();
        }
        
        std::lock_guard<std::mutex> lock(active_mutex_);
        
        // 确保不超出缓冲区容量
        size_t write_count = std::min(count, active_buffer_->size() - *active_size_);
        
        // 复制数据到活动缓冲区
        std::copy(data, data + write_count, active_buffer_->begin() + *active_size_);
        
        // 更新活动缓冲区大小
        *active_size_ += write_count;
        
        return write_count;
    }
    
    // 交换缓冲区,返回处理缓冲区中的数据大小
    size_t swapBuffers() {
        // 设置交换标志
        bool expected = false;
        if (!is_swapping_.compare_exchange_strong(expected, true, std::memory_order_acq_rel)) {
            return 0;  // 已经在交换中,不重复操作
        }
        
        // 锁定两个缓冲区
        std::lock(active_mutex_, process_mutex_);
        std::lock_guard<std::mutex> lock_a(active_mutex_, std::adopt_lock);
        std::lock_guard<std::mutex> lock_b(process_mutex_, std::adopt_lock);
        
        // 记录当前处理缓冲区大小(即将变为活动缓冲区)
        size_t previous_process_size = *process_size_;
        
        // 交换缓冲区指针
        std::swap(active_buffer_, process_buffer_);
        std::swap(active_size_, process_size_);
        
        // 清空新的活动缓冲区计数
        *active_size_ = 0;
        
        // 清除交换标志
        is_swapping_.store(false, std::memory_order_release);
        
        // 返回新处理缓冲区中的数据大小
        return *process_size_;
    }
    
    // 获取处理缓冲区数据
    const std::vector<T>& getProcessBuffer() const {
        return *process_buffer_;
    }
    
    // 获取处理缓冲区大小
    size_t getProcessSize() const {
        std::lock_guard<std::mutex> lock(process_mutex_);
        return *process_size_;
    }
    
    // 读取处理缓冲区数据
    size_t readProcessBuffer(T* output, size_t max_count) const {
        std::lock_guard<std::mutex> lock(process_mutex_);
        
        // 确定读取大小
        size_t read_count = std::min(max_count, *process_size_);
        
        // 复制数据
        std::copy(process_buffer_->begin(), process_buffer_->begin() + read_count, output);
        
        return read_count;
    }
    
    // 获取活动缓冲区大小
    size_t getActiveSize() const {
        std::lock_guard<std::mutex> lock(active_mutex_);
        return *active_size_;
    }
    
    // 获取缓冲区容量
    size_t capacity() const {
        return buffer_a_.size();
    }
    
private:
    std::vector<T> buffer_a_;         // 第一个缓冲区
    std::vector<T> buffer_b_;         // 第二个缓冲区
    size_t size_a_;                   // 缓冲区A中的数据大小
    size_t size_b_;                   // 缓冲区B中的数据大小
    
    std::vector<T>* active_buffer_;   // 指向当前活动缓冲区的指针
    std::vector<T>* process_buffer_;  // 指向当前处理缓冲区的指针
    size_t* active_size_;             // 指向活动缓冲区大小的指针
    size_t* process_size_;            // 指向处理缓冲区大小的指针
    
    std::atomic<bool> is_swapping_;   // 交换操作标志
    mutable std::mutex active_mutex_; // 活动缓冲区互斥锁
    mutable std::mutex process_mutex_; // 处理缓冲区互斥锁
};

#endif // DOUBLE_BUFFER_H

5. 数据采集系统实现实例

5.1 模拟传感器数据采集系统

下面是一个完整的数据采集系统实例,它模拟了多个传感器的数据采集、处理和存储:

cpp

/**
 * sensor_data_acquisition.cpp - 多传感器数据采集系统
 * 
 * 该系统实现了以下功能:
 * 1. 多传感器并行数据采集
 * 2. 实时数据处理与过滤
 * 3. 数据持久化存储
 * 4. 简单的统计分析
 */

#include <iostream>
#include <fstream>
#include <vector>
#include <string>
#include <thread>
#include <mutex>
#include <atomic>
#include <chrono>
#include <queue>
#include <map>
#include <functional>
#include <algorithm>
#include <numeric>
#include <random>
#include <cmath>
#include <iomanip>

// 前向声明
class Sensor;
class DataProcessor;
class DataStorage;
class DataAnalyzer;
class AcquisitionSystem;

// 传感器数据结构
struct SensorData {
    int sensor_id;
    std::string sensor_type;
    double value;
    std::chrono::system_clock::time_point timestamp;
    
    SensorData(int id = 0, const std::string& type = "", double val = 0.0)
        : sensor_id(id), sensor_type(type), value(val),
          timestamp(std::chrono::system_clock::now()) {}
          
    // 格式化为字符串
    std::string toString() const {
        std::stringstream ss;
        auto time_t_ts = std::chrono::system_clock::to_time_t(timestamp);
        ss << "[" << std::put_time(std::localtime(&time_t_ts), "%Y-%m-%d %H:%M:%S") << "] "
           << "Sensor " << sensor_id << " (" << sensor_type << "): " 
           << std::fixed << std::setprecision(2) << value;
        return ss.str();
    }
    
    // 转换为CSV格式
    std::string toCSV() const {
        std::stringstream ss;
        auto time_t_ts = std::chrono::system_clock::to_time_t(timestamp);
        ss << std::put_time(std::localtime(&time_t_ts), "%Y-%m-%d %H:%M:%S") << ","
           << sensor_id << "," << sensor_type << "," 
           << std::fixed << std::setprecision(4) << value;
        return ss.str();
    }
};

// 传感器基类
class Sensor {
public:
    Sensor(int id, const std::string& type, int sampling_interval_ms = 1000)
        : id_(id), type_(type), sampling_interval_ms_(sampling_interval_ms),
          running_(false), error_state_(false) {}
    
    virtual ~Sensor() {
        stop();
    }
    
    // 启动传感器
    virtual bool start() {
        if (running_) return true;
        
        running_ = true;
        sampling_thread_ = std::thread(&Sensor::samplingLoop, this);
        std::cout << "Sensor " << id_ << " (" << type_ << ") started." << std::endl;
        return true;
    }
    
    // 停止传感器
    virtual void stop() {
        if (!running_) return;
        
        running_ = false;
        if (sampling_thread_.joinable()) {
            sampling_thread_.join();
        }
        std::cout << "Sensor " << id_ << " (" << type_ << ") stopped." << std::endl;
    }
    
    // 注册数据回调函数
    void registerDataCallback(std::function<void(const SensorData&)> callback) {
        data_callback_ = callback;
    }
    
    // 获取传感器ID
    int getId() const { return id_; }
    
    // 获取传感器类型
    const std::string& getType() const { return type_; }
    
    // 设置采样间隔
    void setSamplingInterval(int interval_ms) {
        if (interval_ms < 10) interval_ms = 10;  // 最小间隔为10ms
        sampling_interval_ms_ = interval_ms;
    }
    
    // 检查传感器是否处于错误状态
    bool isInErrorState() const { return error_state_; }
    
    // 重置错误状态
    virtual void resetError() { error_state_ = false; }
    
protected:
    // 采样循环
    virtual void samplingLoop() {
        while (running_) {
            try {
                // 读取传感器数据
                double value = readSensor();
                
                // 创建数据对象
                SensorData data(id_, type_, value);
                
                // 调用回调函数
                if (data_callback_) {
                    data_callback_(data);
                }
                
                // 等待下一个采样周期
                auto sleep_time = std::chrono::milliseconds(sampling_interval_ms_);
                std::this_thread::sleep_for(sleep_time);
            } catch (const std::exception& e) {
                std::cerr << "Sensor " << id_ << " error: " << e.what() << std::endl;
                error_state_ = true;
                
                // 错误后短暂休眠
                std::this_thread::sleep_for(std::chrono::milliseconds(1000));
            }
        }
    }
    
    // 读取传感器数据(由具体传感器子类实现)
    virtual double readSensor() = 0;
    
protected:
    int id_;
    std::string type_;
    int sampling_interval_ms_;
    std::atomic<bool> running_;
    std::atomic<bool> error_state_;
    std::thread sampling_thread_;
    std::function<void(const SensorData&)> data_callback_;
};

// 温度传感器
class TemperatureSensor : public Sensor {
public:
    TemperatureSensor(int id, double base_temp = 25.0, double variance = 2.0)
        : Sensor(id, "Temperature", 1000), base_temp_(base_temp), variance_(variance) {
        // 初始化随机数生成器
        std::random_device rd;
        gen_ = std::mt19937(rd());
        dist_ = std::normal_distribution<double>(0.0, 1.0);
    }
    
protected:
    double readSensor() override {
        // 模拟温度读数:基础温度加上随机波动
        double temp = base_temp_ + dist_(gen_) * variance_;
        
        // 模拟传感器故障(低概率)
        if (dist_(gen_) > 2.5) {  // 低于1%的概率
            throw std::runtime_error("Temperature sensor read failure");
        }
        
        return temp;
    }
    
private:
    double base_temp_;
    double variance_;
    std::mt19937 gen_;
    std::normal_distribution<double> dist_;
};

// 湿度传感器
class HumiditySensor : public Sensor {
public:
    HumiditySensor(int id, double base_humidity = 50.0, double variance = 5.0)
        : Sensor(id, "Humidity", 1500), base_humidity_(base_humidity), variance_(variance) {
        // 初始化随机数生成器
        std::random_device rd;
        gen_ = std::mt19937(rd());
        dist_ = std::normal_distribution<double>(0.0, 1.0);
    }
    
protected:
    double readSensor() override {
        // 模拟湿度读数:基础湿度加上随机波动
        double humidity = base_humidity_ + dist_(gen_) * variance_;
        
        // 确保湿度在有效范围内
        humidity = std::min(std::max(humidity, 0.0), 100.0);
        
        return humidity;
    }
    
private:
    double base_humidity_;
    double variance_;
    std::mt19937 gen_;
    std::normal_distribution<double> dist_;
};

// 压力传感器
class PressureSensor : public Sensor {
public:
    PressureSensor(int id, double base_pressure = 1013.25, double variance = 2.0)
        : Sensor(id, "Pressure", 2000), base_pressure_(base_pressure), variance_(variance) {
        // 初始化随机数生成器
        std::random_device rd;
        gen_ = std::mt19937(rd());
        dist_ = std::normal_distribution<double>(0.0, 1.0);
    }
    
protected:
    double readSensor() override {
        // 模拟气压读数:基础气压加上随机波动
        double pressure = base_pressure_ + dist_(gen_) * variance_;
        return pressure;
    }
    
private:
    double base_pressure_;
    double variance_;
    std::mt19937 gen_;
    std::normal_distribution<double> dist_;
};

// 数据处理器类
class DataProcessor {
public:
    // 数据过滤模式
    enum class FilterMode {
        NONE,           // 无过滤
        MOVING_AVERAGE, // 移动平均
        MEDIAN,         // 中值滤波
        KALMAN          // 卡尔曼滤波
    };
    
    DataProcessor(int window_size = 5)
        : window_size_(window_size), filter_mode_(FilterMode::NONE) {}
    
    // 设置过滤模式
    void setFilterMode(FilterMode mode) {
        filter_mode_ = mode;
        
        // 清空过滤器状态
        sensor_data_windows_.clear();
        kalman_states_.clear();
    }
    
    // 设置窗口大小
    void setWindowSize(int size) {
        if (size < 1) size = 1;
        window_size_ = size;
    }
    
    // 处理传感器数据
    SensorData processData(const SensorData& data) {
        // 根据过滤模式应用不同的处理
        SensorData processed_data = data;
        
        switch (filter_mode_) {
            case FilterMode::MOVING_AVERAGE:
                processed_data.value = applyMovingAverage(data);
                break;
            case FilterMode::MEDIAN:
                processed_data.value = applyMedianFilter(data);
                break;
            case FilterMode::KALMAN:
                processed_data.value = applyKalmanFilter(data);
                break;
            case FilterMode::NONE:
            default:
                // 不进行过滤
                break;
        }
        
        return processed_data;
    }
    
private:
    // 应用移动平均过滤
    double applyMovingAverage(const SensorData& data) {
        // 获取该传感器的数据窗口
        auto& window = sensor_data_windows_[data.sensor_id];
        
        // 添加新数据
        window.push_back(data.value);
        
        // 保持窗口大小
        if (window.size() > window_size_) {
            window.erase(window.begin());
        }
        
        // 计算平均值
        double sum = std::accumulate(window.begin(), window.end(), 0.0);
        return sum / window.size();
    }
    
    // 应用中值滤波
    double applyMedianFilter(const SensorData& data) {
        // 获取该传感器的数据窗口
        auto& window = sensor_data_windows_[data.sensor_id];
        
        // 添加新数据
        window.push_back(data.value);
        
        // 保持窗口大小
        if (window.size() > window_size_) {
            window.erase(window.begin());
        }
        
        // 复制窗口数据并排序
        std::vector<double> sorted_window = window;
        std::sort(sorted_window.begin(), sorted_window.end());
        
        // 计算中值
        size_t mid_idx = sorted_window.size() / 2;
        if (sorted_window.size() % 2 == 0) {
            return (sorted_window[mid_idx - 1] + sorted_window[mid_idx]) / 2.0;
        } else {
            return sorted_window[mid_idx];
        }
    }
    
    // 应用卡尔曼滤波
    double applyKalmanFilter(const SensorData& data) {
        // 获取或初始化该传感器的卡尔曼状态
        auto it = kalman_states_.find(data.sensor_id);
        if (it == kalman_states_.end()) {
            // 初始化状态:状态值、协方差、过程噪声、测量噪声
            kalman_states_[data.sensor_id] = {data.value, 1.0, 0.01, 0.1};
            return data.value;
        }
        
        // 提取卡尔曼状态
        double& x = it->second.state;         // 状态估计
        double& p = it->second.covariance;    // 状态协方差
        double q = it->second.process_noise;  // 过程噪声
        double r = it->second.measurement_noise; // 测量噪声
        
        // 预测步骤
        // 状态预测:x = x (简单情况下状态转移矩阵为1)
        // 协方差预测:p = p + q
        p += q;
        
        // 更新步骤
        // 卡尔曼增益:k = p / (p + r)
        double k = p / (p + r);
        
        // 状态更新:x = x + k * (z - x)
        double z = data.value;  // 测量值
        x = x + k * (z - x);
        
        // 协方差更新:p = (1 - k) * p
        p = (1 - k) * p;
        
        return x;
    }
    
private:
    // 卡尔曼滤波状态
    struct KalmanState {
        double state;              // 状态估计
        double covariance;         // 协方差
        double process_noise;      // 过程噪声
        double measurement_noise;  // 测量噪声
    };
    
    int window_size_;
    FilterMode filter_mode_;
    std::map<int, std::vector<double>> sensor_data_windows_;  // 传感器数据窗口
    std::map<int, KalmanState> kalman_states_;                // 卡尔曼滤波状态
};

// 数据存储类
class DataStorage {
public:
    DataStorage(const std::string& base_filename = "sensor_data")
        : base_filename_(base_filename), auto_flush_(true) {
        
        // 创建默认CSV文件名
        csv_filename_ = base_filename_ + ".csv";
        
        // 打开CSV文件并写入标题行
        csv_file_.open(csv_filename_);
        if (csv_file_.is_open()) {
            csv_file_ << "Timestamp,SensorID,SensorType,Value" << std::endl;
        } else {
            std::cerr << "Failed to open CSV file: " << csv_filename_ << std::endl;
        }
    }
    
    ~DataStorage() {
        if (csv_file_.is_open()) {
            csv_file_.close();
        }
    }
    
    // 存储传感器数据
    bool storeData(const SensorData& data) {
        std::lock_guard<std::mutex> lock(file_mutex_);
        
        if (!csv_file_.is_open()) {
            return false;
        }
        
        // 写入CSV格式数据
        csv_file_ << data.toCSV() << std::endl;
        
        // 如果设置了自动刷新,执行刷新
        if (auto_flush_) {
            csv_file_.flush();
        }
        
        // 同时更新内存中的数据缓存
        sensor_data_cache_[data.sensor_id].push_back(data);
        
        // 限制缓存大小
        const size_t MAX_CACHE_SIZE = 1000;  // 每个传感器最多保存1000条记录
        if (sensor_data_cache_[data.sensor_id].size() > MAX_CACHE_SIZE) {
            sensor_data_cache_[data.sensor_id].erase(
                sensor_data_cache_[data.sensor_id].begin());
        }
        
        return true;
    }
    
    // 获取指定传感器的最新数据
    SensorData getLatestData(int sensor_id) const {
        std::lock_guard<std::mutex> lock(file_mutex_);
        
        auto it = sensor_data_cache_.find(sensor_id);
        if (it != sensor_data_cache_.end() && !it->second.empty()) {
            return it->second.back();
        }
        
        return SensorData();  // 返回空数据
    }
    
    // 获取指定传感器的历史数据
    std::vector<SensorData> getHistoryData(int sensor_id, size_t max_count = 0) const {
        std::lock_guard<std::mutex> lock(file_mutex_);
        
        auto it = sensor_data_cache_.find(sensor_id);
        if (it == sensor_data_cache_.end()) {
            return std::vector<SensorData>();
        }
        
        if (max_count == 0 || max_count >= it->second.size()) {
            return it->second;
        }
        
        // 返回最近的max_count条记录
        return std::vector<SensorData>(
            it->second.end() - max_count, it->second.end());
    }
    
    // 设置自动刷新
    void setAutoFlush(bool enable) {
        auto_flush_ = enable;
    }
    
    // 手动刷新文件
    void flush() {
        std::lock_guard<std::mutex> lock(file_mutex_);
        if (csv_file_.is_open()) {
            csv_file_.flush();
        }
    }
    
    // 获取文件名
    const std::string& getFilename() const {
        return csv_filename_;
    }
    
private:
    std::string base_filename_;
    std::string csv_filename_;
    std::ofstream csv_file_;
    bool auto_flush_;
    mutable std::mutex file_mutex_;
    std::map<int, std::vector<SensorData>> sensor_data_cache_;
};

// 数据分析器类
class DataAnalyzer {
public:
    // 基本统计分析
    struct Statistics {
        double min;
        double max;
        double mean;
        double median;
        double stddev;
        size_t count;
        
        Statistics() : min(0), max(0), mean(0), median(0), stddev(0), count(0) {}
        
        std::string toString() const {
            std::stringstream ss;
            ss << "Count: " << count << ", "
               << "Min: " << std::fixed << std::setprecision(2) << min << ", "
               << "Max: " << std::fixed << std::setprecision(2) << max << ", "
               << "Mean: " << std::fixed << std::setprecision(2) << mean << ", "
               << "Median: " << std::fixed << std::setprecision(2) << median << ", "
               << "StdDev: " << std::fixed << std::setprecision(2) << stddev;
            return ss.str();
        }
    };
    
    // 计算统计信息
    Statistics calculateStatistics(const std::vector<SensorData>& data) const {
        Statistics stats;
        
        if (data.empty()) {
            return stats;
        }
        
        stats.count = data.size();
        
        // 提取值
        std::vector<double> values;
        values.reserve(data.size());
        for (const auto& d : data) {
            values.push_back(d.value);
        }
        
        // 计算最小和最大值
        auto minmax = std::minmax_element(values.begin(), values.end());
        stats.min = *minmax.first;
        stats.max = *minmax.second;
        
        // 计算平均值
        stats.mean = std::accumulate(values.begin(), values.end(), 0.0) / values.size();
        
        // 计算中位数
        std::vector<double> sorted_values = values;
        std::sort(sorted_values.begin(), sorted_values.end());
        size_t mid_idx = sorted_values.size() / 2;
        if (sorted_values.size() % 2 == 0) {
            stats.median = (sorted_values[mid_idx - 1] + sorted_values[mid_idx]) / 2.0;
        } else {
            stats.median = sorted_values[mid_idx];
        }
        
        // 计算标准差
        double variance_sum = 0.0;
        for (double v : values) {
            double diff = v - stats.mean;
            variance_sum += diff * diff;
        }
        stats.stddev = std::sqrt(variance_sum / values.size());
        
        return stats;
    }
    
    // 检测异常值(简单的基于Z分数的方法)
    std::vector<SensorData> detectAnomalies(const std::vector<SensorData>& data, double threshold = 2.0) const {
        std::vector<SensorData> anomalies;
        
        if (data.size() < 2) {
            return anomalies;
        }
        
        // 计算平均值和标准差
        double sum = 0.0;
        for (const auto& d : data) {
            sum += d.value;
        }
        double mean = sum / data.size();
        
        double variance_sum = 0.0;
        for (const auto& d : data) {
            double diff = d.value - mean;
            variance_sum += diff * diff;
        }
        double stddev = std::sqrt(variance_sum / data.size());
        
        // 如果标准差接近于0,无法有效检测异常
        if (stddev < 1e-10) {
            return anomalies;
        }
        
        // 检测异常值
        for (const auto& d : data) {
            double z_score = std::abs(d.value - mean) / stddev;
            if (z_score > threshold) {
                anomalies.push_back(d);
            }
        }
        
        return anomalies;
    }
    
    // 计算相关性
    double calculateCorrelation(const std::vector<SensorData>& data1, 
                               const std::vector<SensorData>& data2) const {
        // 需要相同数量的数据点
        if (data1.size() != data2.size() || data1.empty()) {
            return 0.0;
        }
        
        // 提取值
        std::vector<double> values1, values2;
        values1.reserve(data1.size());
        values2.reserve(data2.size());
        
        for (size_t i = 0; i < data1.size(); i++) {
            values1.push_back(data1[i].value);
            values2.push_back(data2[i].value);
        }
        
        // 计算均值
        double mean1 = std::accumulate(values1.begin(), values1.end(), 0.0) / values1.size();
        double mean2 = std::accumulate(values2.begin(), values2.end(), 0.0) / values2.size();
        
        // 计算协方差和标准差
        double covariance = 0.0;
        double variance1 = 0.0;
        double variance2 = 0.0;
        
        for (size_t i = 0; i < values1.size(); i++) {
            double diff1 = values1[i] - mean1;
            double diff2 = values2[i] - mean2;
            
            covariance += diff1 * diff2;
            variance1 += diff1 * diff1;
            variance2 += diff2 * diff2;
        }
        
        covariance /= values1.size();
        variance1 /= values1.size();
        variance2 /= values1.size();
        
        double stddev1 = std::sqrt(variance1);
        double stddev2 = std::sqrt(variance2);
        
        // 避免除以0
        if (stddev1 < 1e-10 || stddev2 < 1e-10) {
            return 0.0;
        }
        
        // 计算相关系数
        return covariance / (stddev1 * stddev2);
    }
};

// 数据采集系统类
class AcquisitionSystem {
public:
    AcquisitionSystem()
        : running_(false), 
          data_processor_(5),  // 使用窗口大小为5的数据处理器
          data_storage_("sensor_data") {}
    
    ~AcquisitionSystem() {
        stop();
    }
    
    // 添加传感器
    void addSensor(std::shared_ptr<Sensor> sensor) {
        std::lock_guard<std::mutex> lock(sensors_mutex_);
        sensors_[sensor->getId()] = sensor;
        
        // 注册数据回调
        sensor->registerDataCallback(
            [this](const SensorData& data) {
                this->handleSensorData(data);
            }
        );
        
        std::cout << "Added sensor " << sensor->getId() << " (" << sensor->getType() << ")" << std::endl;
    }
    
    // 移除传感器
    void removeSensor(int sensor_id) {
        std::lock_guard<std::mutex> lock(sensors_mutex_);
        
        auto it = sensors_.find(sensor_id);
        if (it != sensors_.end()) {
            it->second->stop();
            sensors_.erase(it);
            std::cout << "Removed sensor " << sensor_id << std::endl;
        }
    }
    
    // 启动系统
    bool start() {
        if (running_) return true;
        
        std::lock_guard<std::mutex> lock(sensors_mutex_);
        
        // 启动所有传感器
        for (auto& sensor_pair : sensors_) {
            sensor_pair.second->start();
        }
        
        running_ = true;
        std::cout << "Acquisition system started" << std::endl;
        return true;
    }
    
    // 停止系统
    void stop() {
        if (!running_) return;
        
        std::lock_guard<std::mutex> lock(sensors_mutex_);
        
        // 停止所有传感器
        for (auto& sensor_pair : sensors_) {
            sensor_pair.second->stop();
        }
        
        // 刷新存储
        data_storage_.flush();
        
        running_ = false;
        std::cout << "Acquisition system stopped" << std::endl;
    }
    
    // 设置滤波模式
    void setFilterMode(DataProcessor::FilterMode mode) {
        data_processor_.setFilterMode(mode);
        
        std::string mode_name;
        switch (mode) {
            case DataProcessor::FilterMode::NONE:
                mode_name = "None";
                break;
            case DataProcessor::FilterMode::MOVING_AVERAGE:
                mode_name = "Moving Average";
                break;
            case DataProcessor::FilterMode::MEDIAN:
                mode_name = "Median";
                break;
            case DataProcessor::FilterMode::KALMAN:
                mode_name = "Kalman";
                break;
        }
        
        std::cout << "Filter mode set to: " << mode_name << std::endl;
    }
    
    // 获取传感器列表
    std::vector<std::pair<int, std::string>> getSensorList() const {
        std::lock_guard<std::mutex> lock(sensors_mutex_);
        
        std::vector<std::pair<int, std::string>> sensor_list;
        for (const auto& sensor_pair : sensors_) {
            sensor_list.emplace_back(
                sensor_pair.first, sensor_pair.second->getType());
        }
        
        return sensor_list;
    }
    
    // 获取特定传感器的最新数据
    SensorData getLatestData(int sensor_id) const {
        return data_storage_.getLatestData(sensor_id);
    }
    
    // 获取特定传感器的历史数据
    std::vector<SensorData> getHistoryData(int sensor_id, size_t max_count = 0) const {
        return data_storage_.getHistoryData(sensor_id, max_count);
    }
    
    // 获取特定传感器的统计信息
    DataAnalyzer::Statistics getSensorStatistics(int sensor_id) const {
        auto history = data_storage_.getHistoryData(sensor_id);
        return data_analyzer_.calculateStatistics(history);
    }
    
    // 检测特定传感器的异常值
    std::vector<SensorData> detectAnomalies(int sensor_id, double threshold = 2.0) const {
        auto history = data_storage_.getHistoryData(sensor_id);
        return data_analyzer_.detectAnomalies(history, threshold);
    }
    
    // 计算两个传感器之间的相关性
    double calculateCorrelation(int sensor_id1, int sensor_id2) const {
        auto history1 = data_storage_.getHistoryData(sensor_id1);
        auto history2 = data_storage_.getHistoryData(sensor_id2);
        
        // 确保两个历史数据长度相同
        size_t min_size = std::min(history1.size(), history2.size());
        if (min_size == 0) {
            return 0.0;
        }
        
        if (history1.size() > min_size) {
            history1.erase(history1.begin(), history1.end() - min_size);
        }
        
        if (history2.size() > min_size) {
            history2.erase(history2.begin(), history2.end() - min_size);
        }
        
        return data_analyzer_.calculateCorrelation(history1, history2);
    }
    
    // 获取存储文件名
    const std::string& getStorageFilename() const {
        return data_storage_.getFilename();
    }
    
    // 检查系统是否正在运行
    bool isRunning() const {
        return running_;
    }
    
private:
    // 处理传感器数据
    void handleSensorData(const SensorData& data) {
        // 处理数据
        SensorData processed_data = data_processor_.processData(data);
        
        // 存储处理后的数据
        data_storage_.storeData(processed_data);
        
        // 打印数据(实际应用中可能不需要)
        std::cout << processed_data.toString() << std::endl;
    }
    
private:
    std::atomic<bool> running_;
    std::map<int, std::shared_ptr<Sensor>> sensors_;
    mutable std::mutex sensors_mutex_;
    DataProcessor data_processor_;
    DataStorage data_storage_;
    DataAnalyzer data_analyzer_;
};

// 简单的命令行接口
class CommandLineInterface {
public:
    CommandLineInterface(AcquisitionSystem& system)
        : system_(system), running_(false) {}
    
    // 启动命令行界面
    void start() {
        if (running_) return;
        
        running_ = true;
        cli_thread_ = std::thread(&CommandLineInterface::cliLoop, this);
    }
    
    // 停止命令行界面
    void stop() {
        if (!running_) return;
        
        running_ = false;
        if (cli_thread_.joinable()) {
            cli_thread_.join();
        }
    }
    
private:
    // 命令行循环
    void cliLoop() {
        printHelp();
        
        while (running_) {
            std::cout << "> ";
            std::string command;
            std::getline(std::cin, command);
            
            if (command.empty()) continue;
            
            // 解析命令
            std::istringstream iss(command);
            std::string cmd;
            iss >> cmd;
            
            if (cmd == "help" || cmd == "h") {
                printHelp();
            }
            else if (cmd == "start") {
                system_.start();
            }
            else if (cmd == "stop") {
                system_.stop();
            }
            else if (cmd == "status") {
                printStatus();
            }
            else if (cmd == "sensors") {
                listSensors();
            }
            else if (cmd == "data") {
                int sensor_id;
                if (iss >> sensor_id) {
                    showSensorData(sensor_id);
                } else {
                    std::cout << "Usage: data <sensor_id>" << std::endl;
                }
            }
            else if (cmd == "stats") {
                int sensor_id;
                if (iss >> sensor_id) {
                    showSensorStats(sensor_id);
                } else {
                    std::cout << "Usage: stats <sensor_id>" << std::endl;
                }
            }
            else if (cmd == "anomalies") {
                int sensor_id;
                double threshold = 2.0;
                if (iss >> sensor_id) {
                    iss >> threshold;  // 可选参数
                    showAnomalies(sensor_id, threshold);
                } else {
                    std::cout << "Usage: anomalies <sensor_id> [threshold]" << std::endl;
                }
            }
            else if (cmd == "correlation") {
                int sensor_id1, sensor_id2;
                if (iss >> sensor_id1 >> sensor_id2) {
                    showCorrelation(sensor_id1, sensor_id2);
                } else {
                    std::cout << "Usage: correlation <sensor_id1> <sensor_id2>" << std::endl;
                }
            }
            else if (cmd == "filter") {
                std::string mode;
                if (iss >> mode) {
                    setFilterMode(mode);
                } else {
                    std::cout << "Usage: filter <none|average|median|kalman>" << std::endl;
                }
            }
            else if (cmd == "exit" || cmd == "quit" || cmd == "q") {
                break;
            }
            else {
                std::cout << "Unknown command: " << cmd << std::endl;
            }
        }
        
        std::cout << "CLI stopped. System will continue running." << std::endl;
    }
    
    // 打印帮助信息
    void printHelp() {
        std::cout << "\n--- Data Acquisition System Command Line Interface ---\n";
        std::cout << "Available commands:\n";
        std::cout << "  help        - Show this help\n";
        std::cout << "  start       - Start data acquisition\n";
        std::cout << "  stop        - Stop data acquisition\n";
        std::cout << "  status      - Show system status\n";
        std::cout << "  sensors     - List all sensors\n";
        std::cout << "  data <id>   - Show latest data for sensor\n";
        std::cout << "  stats <id>  - Show statistics for sensor\n";
        std::cout << "  anomalies <id> [threshold] - Detect anomalies\n";
        std::cout << "  correlation <id1> <id2>   - Calculate correlation\n";
        std::cout << "  filter <mode>   - Set filter mode (none, average, median, kalman)\n";
        std::cout << "  exit/quit   - Exit CLI\n";
        std::cout << "----------------------------------------------------\n";
    }
    
    // 打印系统状态
    void printStatus() {
        std::cout << "System status: " << (system_.isRunning() ? "Running" : "Stopped") << std::endl;
        std::cout << "Data file: " << system_.getStorageFilename() << std::endl;
        std::cout << "Sensor count: " << system_.getSensorList().size() << std::endl;
    }
    
    // 列出所有传感器
    void listSensors() {
        auto sensors = system_.getSensorList();
        
        if (sensors.empty()) {
            std::cout << "No sensors configured" << std::endl;
            return;
        }
        
        std::cout << "Configured sensors:" << std::endl;
        for (const auto& sensor : sensors) {
            SensorData latest = system_.getLatestData(sensor.first);
            std::cout << "[" << sensor.first << "] " << sensor.second;
            
            if (latest.sensor_id != 0) {  // 有有效数据
                std::cout << " - Latest: " << std::fixed << std::setprecision(2) << latest.value;
            }
            
            std::cout << std::endl;
        }
    }
    
    // 显示传感器数据
    void showSensorData(int sensor_id) {
        SensorData latest = system_.getLatestData(sensor_id);
        
        if (latest.sensor_id == 0) {
            std::cout << "No data available for sensor " << sensor_id << std::endl;
            return;
        }
        
        std::cout << "Latest data for sensor " << sensor_id << " (" << latest.sensor_type << "):" << std::endl;
        std::cout << latest.toString() << std::endl;
        
        // 获取最近10条历史记录
        auto history = system_.getHistoryData(sensor_id, 10);
        if (history.size() > 1) {
            std::cout << "\nRecent history:" << std::endl;
            for (const auto& data : history) {
                std::cout << data.toString() << std::endl;
            }
        }
    }
    
    // 显示传感器统计信息
    void showSensorStats(int sensor_id) {
        auto stats = system_.getSensorStatistics(sensor_id);
        
        if (stats.count == 0) {
            std::cout << "No data available for sensor " << sensor_id << std::endl;
            return;
        }
        
        std::cout << "Statistics for sensor " << sensor_id << ":" << std::endl;
        std::cout << stats.toString() << std::endl;
    }
    
    // 显示异常值
    void showAnomalies(int sensor_id, double threshold) {
        auto anomalies = system_.detectAnomalies(sensor_id, threshold);
        
        if (anomalies.empty()) {
            std::cout << "No anomalies detected for sensor " << sensor_id 
                     << " (threshold: " << threshold << ")" << std::endl;
            return;
        }
        
        std::cout << "Detected " << anomalies.size() << " anomalies for sensor " 
                 << sensor_id << " (threshold: " << threshold << "):" << std::endl;
        
        for (const auto& data : anomalies) {
            std::cout << data.toString() << std::endl;
        }
    }
    
    // 显示相关性
    void showCorrelation(int sensor_id1, int sensor_id2) {
        double correlation = system_.calculateCorrelation(sensor_id1, sensor_id2);
        
        std::cout << "Correlation between sensor " << sensor_id1 << " and " 
                 << sensor_id2 << ": " << std::fixed << std::setprecision(4) 
                 << correlation << std::endl;
        
        // 解释相关性
        std::cout << "Interpretation: ";
        if (std::abs(correlation) < 0.3) {
            std::cout << "Weak correlation";
        } else if (std::abs(correlation) < 0.7) {
            std::cout << "Moderate correlation";
        } else {
            std::cout << "Strong correlation";
        }
        
        if (correlation > 0) {
            std::cout << " (positive)";
        } else if (correlation < 0) {
            std::cout << " (negative)";
        }
        
        std::cout << std::endl;
    }
    
    // 设置滤波模式
    void setFilterMode(const std::string& mode) {
        if (mode == "none") {
            system_.setFilterMode(DataProcessor::FilterMode::NONE);
        }
        else if (mode == "average") {
            system_.setFilterMode(DataProcessor::FilterMode::MOVING_AVERAGE);
        }
        else if (mode == "median") {
            system_.setFilterMode(DataProcessor::FilterMode::MEDIAN);
        }
        else if (mode == "kalman") {
            system_.setFilterMode(DataProcessor::FilterMode::KALMAN);
        }
        else {
            std::cout << "Unknown filter mode: " << mode << std::endl;
            std::cout << "Available modes: none, average, median, kalman" << std::endl;
        }
    }
    
private:
    AcquisitionSystem& system_;
    std::atomic<bool> running_;
    std::thread cli_thread_;
};

// 主函数
int main() {
    // 创建数据采集系统
    AcquisitionSystem system;
    
    // 添加传感器
    system.addSensor(std::make_shared<TemperatureSensor>(1, 25.0, 1.0));
    system.addSensor(std::make_shared<TemperatureSensor>(2, 22.0, 0.5));
    system.addSensor(std::make_shared<HumiditySensor>(3, 45.0, 3.0));
    system.addSensor(std::make_shared<PressureSensor>(4, 1013.0, 1.0));
    
    // 设置默认滤波模式
    system.setFilterMode(DataProcessor::FilterMode::MOVING_AVERAGE);
    
    // 创建命令行界面
    CommandLineInterface cli(system);
    
    // 启动系统
    system.start();
    
    // 启动命令行界面
    cli.start();
    
    // 等待CLI线程结束(当用户输入exit命令时)
    cli.stop();
    
    // 停止系统
    system.stop();
    
    std::cout << "Data saved to " << system.getStorageFilename() << std::endl;
    std::cout << "Program terminated." << std::endl;
    
    return 0;
}

5.2 数据采集系统的高级设计考虑

在开发实际的数据采集系统时,需要考虑以下高级设计因素:

  1. 扩展性设计

    • 使用工厂模式创建不同类型的传感器设备
    • 插件架构支持新设备和协议的动态加载
    • 可配置的数据处理管道
  2. 容错与可靠性

    • 传感器错误检测和恢复机制
    • 数据暂存和重传功能
    • 看门狗定时器监控系统健康状态
    • 断电恢复能力
  3. 性能优化

    • 多级缓存策略减少I/O瓶颈
    • 采用无锁编程技术减少线程同步开销
    • 使用内存映射文件加速数据存储
  4. 安全性考虑

    • 加密敏感数据
    • 实现访问控制机制
    • 数据完整性校验
  5. 监控与诊断

    • 内置性能监控组件
    • 系统日志与错误报告功能
    • 状态健康检查接口

6. 数据采集上位机系统优化

6.1 提高采集性能的关键策略

  1. 数据采集瓶颈识别

    • 使用性能分析工具定位性能瓶颈
    • 监控CPU、内存、I/O使用情况
    • 分析线程争用和锁竞争
  2. 并行采集优化

    • 根据设备特性调整线程数量
    • 使用线程池管理采集任务
    • 考虑非阻塞I/O和异步操作
  3. 内存管理优化

    • 减少不必要的数据复制
    • 实现对象池减少内存分配开销
    • 使用内存预分配策略
  4. 缓冲区调优

    • 针对采集速率调整缓冲区大小
    • 实现自适应缓冲区管理
    • 批处理数据减少系统调用次数

6.2 数据压缩与存储优化

在高速数据采集系统中,数据存储往往成为瓶颈。以下是一些优化策略:

  1. 数据压缩技术

    • 无损压缩:zlib、LZ4、Snappy等
    • 有损压缩:降采样、量化、小波变换等
    • 增量编码:只存储差值数据
  2. 存储格式选择

    • 二进制格式:高效但不易读取
    • 结构化格式:CSV、JSON、XML等
    • 专用格式:HDF5、TDMS、Parquet等
  3. I/O优化

    • 批量写入代替频繁写入
    • 使用内存映射文件
    • 异步I/O操作
    • 数据日志循环写入
  4. 分层存储策略

    • 热数据保存在内存或SSD
    • 冷数据迁移到硬盘或云存储
    • 自动归档与管理策略

6.3 实时性保障技术

许多数据采集应用要求严格的实时性,以下是一些保障实时性的技术:

  1. 定时精度优化

    • 使用高精度计时器
    • 补偿和校正时间漂移
    • 实现固定采样率控制
  2. 优先级管理

    • 提高采集线程优先级
    • 在支持的平台上使用实时调度策略
    • 避免优先级倒置问题
  3. 减少抖动

    • 减少系统调用和I/O操作
    • 避免内存分配和垃圾回收
    • 使用预定时技术避免唤醒延迟
  4. 实时响应策略

    • 实现数据触发机制
    • 使用条件变量高效唤醒处理线程
    • 建立优先级队列处理紧急数据
  5. 分布式时间同步

    • 使用NTP或PTP协议同步多设备时钟
    • 实现时间戳补偿算法
    • 支持绝对时间与相对时间采集方式

7. 总结与实践建议

7.1 数据采集系统设计原则

  1. 模块化设计:将系统分解为独立、可替换的模块
  2. 关注点分离:明确划分采集、处理、存储和分析职责
  3. 可扩展性:支持添加新设备、新协议和新功能
  4. 可测试性:设计易于测试的接口和组件
  5. 错误处理:全面考虑异常情况和错误恢复
  6. 性能平衡:在实时性、吞吐量和资源消耗间取得平衡

7.2 实践经验总结

  1. 从简单开始:先实现基本功能,再逐步优化
  2. 充分测试:构建自动化测试套件,验证各种工作条件
  3. 监控与日志:实现全面的监控和日志系统,帮助诊断问题
  4. 用户交互:设计直观的界面和清晰的错误提示
  5. 文档完善:编写详细文档,包括架构设计、API和用户手册
  6. 性能基准:建立性能基准测试,评估改进效果

7.3 发展趋势展望

数据采集技术正在经历以下几个重要发展方向:

  1. 边缘计算:将数据处理前移到采集点,减少传输负担
  2. 云集成:数据采集系统与云平台无缝集成
  3. AI融合:嵌入机器学习算法实现智能分析和异常检测
  4. 安全加强:加强数据安全和隐私保护
  5. 开放标准:采用开放数据格式和通信标准
  6. 虚拟化与容器化:使用容器技术简化部署和扩展

数据采集作为工业自动化、科学研究、物联网等领域的基础技术,其重要性将持续增长。掌握现代数据采集系统的开发技术,将使开发者能够构建高效、可靠、可扩展的解决方案,满足各种复杂应用场景的需求。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐